暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

MySQL 从不固定位置提取字符串元素

原创 只是甲 2021-03-01
376

备注:测试数据库版本为MySQL 8.0

测试数据:

create table zqs(id int,str varchar(1000)); insert into zqs(id,str) values (1,'【京东】abc【中国电信】'); insert into zqs(id,str) values (1,'【京东】abc【中国电信】def'); insert into zqs(id,str) values (1,'****【京东】abc【中国电信】def'); insert into zqs(id,str) values (1,'****【京东】abc'); insert into zqs(id,str) values (1,'【京东】abc【中国电信】【中国联通】');
复制

一.需求

经常遇到短信类似的需求,需要提取短信的标记信息,但是可能会存在多个短信标记
此例假设最多有3个标签,需要输出如下:

mysql> select * from zqs;
±-----±----------------------------------------------------+
| id | str |
±-----±----------------------------------------------------+
| 1 | 【京东】abc【中国电信】 |
| 1 | 【京东】abc【中国电信】def |
| 1 | ****【京东】abc【中国电信】def |
| 1 | ****【京东】abc |
| 1 | 【京东】abc【中国电信】【中国联通】 |
±-----±----------------------------------------------------+

要求输出如下:
±-------------±-------------------±-------------------+
| first_val | first_va2 | first_va3 |
±-------------±-------------------±-------------------+
| 【京东】 | 【中国电信】 | |
| 【京东】 | 【中国电信】 | |
| 【京东】 | 【中国电信】 | |
| 【京东】 | | |
| 【京东】 | 【中国电信】 | 【中国联通】 |
±-------------±-------------------±-------------------+

二.解决方案

Oracle 字符串截取函数 substr和instr配合使用即可,但是MySQL的instr函数是弱于Oracle的instr函数。
此时需要借助MySQL的正则表达式 regexp_instr函数以及substr函数配合

select substr(str, regexp_instr(str,'【',1,1), regexp_instr(str,'】',1,1) - regexp_instr(str,'【',1,1) + 1 ) first_val, substr(str, regexp_instr(str,'【',1,2), regexp_instr(str,'】',1,2) - regexp_instr(str,'【',1,2) + 1) first_va2, substr(str, regexp_instr(str,'【',1,3), regexp_instr(str,'】',1,3) - regexp_instr(str,'【',1,3) + 1) first_va3 from zqs;
复制

测试记录:

mysql> select  substr(str,
    ->          regexp_instr(str,'【',1,1),
    ->          regexp_instr(str,'】',1,1) - regexp_instr(str,'【',1,1) + 1 ) first_val,
    ->         substr(str,
    ->          regexp_instr(str,'【',1,2),
    ->          regexp_instr(str,'】',1,2) - regexp_instr(str,'【',1,2) + 1) first_va2,
    ->         substr(str,
    ->          regexp_instr(str,'【',1,3),
    ->          regexp_instr(str,'】',1,3) - regexp_instr(str,'【',1,3) + 1) first_va3
    ->   from  zqs;
+--------------+--------------------+--------------------+
| first_val    | first_va2          | first_va3          |
+--------------+--------------------+--------------------+
| 【京东】     | 【中国电信】       |                    |
| 【京东】     | 【中国电信】       |                    |
| 【京东】     | 【中国电信】       |                    |
| 【京东】     |                    |                    |
| 【京东】     | 【中国电信】       | 【中国联通】       |
+--------------+--------------------+--------------------+
5 rows in set (0.00 sec)
复制
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

文章被以下合辑收录

评论