本文为您介绍如何使用实时计算字符串函数REGEXP_EXTRACT。

语法

VARCHAR REGEXP_EXTRACT(VARCHAR str, VARCHAR pattern, INT index)

入参

参数 数据类型 说明
str VARCHAR 指定的字符串。
pattern VARCHAR 匹配的字符串。
index INT 第几个被匹配的字符串。
注意 正则常量请按照Java代码来写。codegen会将SQL常量字符串自动转化成Java代码。如果要描述一个数字(\d),需要写成 '\d',也就是像在Java中写正则一样。

功能描述

使用正则模式pattern匹配抽取字符串str中的第index个子串,index从1开始,正则匹配提取。参数为null或者正则不合法返回null。

示例

  • 测试数据
    str1 (VARCHAR) pattern1(VARCHAR) index1 (INT)
    foothebar foo(.*?)(bar) 2
    100-200 (\\d+)-(\\d+) 1
    null foo(.*?)(bar) 2
    foothebar null 2
    foothebar 2
    foothebar ( 2
  • 测试语句
    SELECT  REGEXP_EXTRACT(str1, pattern1, index1) as result
    FROM T1
    
  • 测试结果
    result(VARCHAR)
    bar
    100
    null
    null
    null
    null