SPLIT

SPLIT函数使用指定分隔符(pat)对输入字符串(str)进行分割,返回字符串数组。

命令格式

split(<str>, <pat>, [<trimTailEmpty>])

参数说明

  • str:必填。STRING类型,表示待分割的原始字符串。

  • pat:必填。STRING类型的分隔符,支持正则表达式语法。

  • trimTailEmpty: 可选参数,默认值为true,设置为false时保留末尾空字符串 (Hive兼容)。

返回值说明

返回ARRAY数组。数组中的元素为STRING类型。

使用示例

--返回["a"," b"," c"]
select split("a, b, c", ",");

--默认不返回空字符串
select split("a, b, c,,", ",");
--返回结果
+------------+
| _c0        |
+------------+
| ["a"," b"," c"] |
+------------+

--如果需要返回空字符串
select split("a, b, c,,", ",", false);
--返回结果
+------------+
| _c0        |
+------------+
| ["a"," b"," c","",""] |
+------------+

相关函数

SPLIT函数属于复杂类型函数,更多对复杂类型数据(例如ARRAY、MAP、STRUCT、JSON数据)的处理函数请参见复杂类型函数