本节描述了用于检查和操作字符串值的函数和操作符。
在这个环境中的串包括所有类型character
、character varying
和text
的值。 除非特别说明,这些函数和操作符声明为接受并返回text
类型。 他们将互换接受character varying
参数。 在应用函数或操作符之前character
类型的值将被转换为text
,结果删除character
值中的任何末尾空格。
SQL 定义了一些字符串函数,它们使用关键字,而不是逗号来分隔参数。详情请见 SQL 字符串函数和操作符表,本数据库也提供了这些函数使用正常函数调用语法的版本(见其他字符串函数表)。
由于存在从那些数据类型到text
的隐式强制措施,在本数据库 8.3 之前,这些函数也可以接受多种非字符串数据类型。这些强制措施在目前的版本中已经被删除,因为它们常常导致令人惊讶的行为。不过,字符串串接操作符(||
)仍然接受非字符串输入,只要至少一个输入是一种字符串类型,如 SQL 字符串函数和操作符表所示。对于其他情况,如果你需要复制之前的行为,可以为text
插入一个显式强制措施。
SQL字符串函数和操作符
连接两个字符串。
|
将非字符串输入转换为文本,然后将两个字符串串联在一起。 (非字符串输入不能为数组类型,因为这将在
|
检查字符串是否在指定的 Unicode 规范化表单中。 可选的
|
返回字符串中的位数(8倍于
|
返回字符串中的字符数。
|
根据数据库的语言环境规则,将字符串转换为全部小写。
|
将字符串转换为指定的Unicode规范化形式。 可选的
|
返回字符串的字节数。
|
返回字符串中的字节数。 由于此版本的函数直接接受
|
替换
|
返回指定的
|
如果已指定,提取
|
提取匹配POSIX正则表达式的子字符串。
|
提取匹配 SQL 正则表达式的字串。
|
从
|
这是一个非标准的
|
根据数据库的定位规则,将字符串转换为所有大写。
|
还有额外的串操作函数可以用,它们在其他字符串函数表中列出。它们有些在内部用于实现 SQL 字符串函数和操作符表列出的 SQL 标准字符串函数。
其他字符串函数
返回参数的第一个字符的数字代码。在UTF8编码中,返回该字符的Unicode代码点。 在其他多字节编码中,该参数必须是一个ASCII字符。
|
从
|
返回给定代码的字符。在UTF8编码中该参数被视作一个Unicode代码点。 在其他多字节编码中该参数必须指定一个ASCII字符。
|
连接所有参数的文本表示。空参数被忽略。
|
用分隔符连接除第一个参数外的所有参数。第一个参数用作分隔符字符串,不应为NULL。其他NULL参数将被忽略。
|
根据格式字符串对参数进行格式化。 这个函数类似于C函数
|
将每个单词的第一个字母转换为大写,其余字母转换为小写。单词是由非字母数字字符分隔的字母数字字符序列。
|
以字符串返回第一个
|
返回字符串中的字符数。
|
将
|
从
|
计算参数的 MD5 hash ,结果以十六进制形式写入。
|
将
|
返回当前客户端编码名称。
|
返回适合引用的给定字符串,作为SQL语句字符串中的标识符。 只有在必要的情况下才添加引号(例如,如果字符串包含非标识符字符或将被大小写折叠)。 嵌入的引号被适当地加双引号。
|
返回在SQL语句字符串中适当引用的给定字符串,用作字符串文字使用。 嵌入式单引号和反斜线适当的翻倍(转双引号或双斜线)。 请注意,
|
将给定的值转换为文本,然后将其作为字面量引用。 内嵌的单引号和反斜杠被适当地翻倍。
|
返回在SQL语句字符串中适当引用的给定字符串文字;或者,如果参数为null,则返回
|
将给定值转换为文本,然后将其作为字面量引用;或者,如果参数为null,则返回
|
返回从POSIX正则表达式到
|
返回通过将POSIX正则表达式与
|
替换匹配POSIX正则表达式的子字符串。
|
使用POSIX正则表达式作为分隔符拆分
|
使用POSIX正则表达式作为分隔符拆分
|
重复
|
将
|
颠倒字符串中字符的顺序。
|
返回字符串中的最后
|
扩展
|
从
|
在
|
返回在
|
提取
|
如果
|
将
|
将数字转换为其相应的十六进制表示形式。
|
将
|
concat
、concat_ws
和format
函数是可变的,因此可以把要串接或格式化的值作为一个标记了VARIADIC
关键字的数组进行传递。 数组的元素被当作函数的独立普通参数一样处理。如果可变数组参数为 NULL,concat
和concat_ws
返回 NULL,但format
把 NULL 当作一个零元素数组。
format
函数format
根据一个格式字符串产生格式化的输出,其形式类似于 C 函数sprintf
。
format(formatstr text [, formatarg "any" [, ...] ])
formatstr
是一个格式字符串,它指定了结果应该如何被格式化。格式字符串中的文本被直接复制到结果中,除了使用格式说明符的地方。格式说明符在字符串中扮演着占位符的角色,它定义后续的函数参数如何被格式化及插入到结果中。每一个formatarg
参数会被根据其数据类型的常规输出规则转换为文本,并接着根据格式说明符被格式化和插入到结果字符串中。
格式说明符由一个%
字符开始并且有这样的形式
%[position][flags][width]type
其中的各组件域是:
position
(可选)一个形式为n``$
的字符串,其中n
是要打印的参数的索引。索引 1 表示formatstr
之后的第一个参数。如果position
被忽略,默认会使用序列中的下一个参数。
flags
(可选)控制格式说明符的输出如何被格式化的附加选项。当前唯一支持的标志是一个负号(-
),它将导致格式说明符的输出会被左对齐(left-justified)。除非width
域也被指定,否者这个域不会产生任何效果。
width
(可选)指定用于显示格式说明符输出的最小字符数。输出将被在左部或右部(取决于-
标志)用空格填充以保证充满该宽度。太小的宽度设置不会导致输出被截断,但是会被简单地忽略。宽度可以使用下列形式之一指定:一个正整数;一个星号()表示使用下一个函数参数作为宽度;或者一个形式为```n
$的字符串表示使用第
n`个函数参数作为宽度。
如果宽度来自于一个函数参数,则参数在被格式说明符的值使用之前就被消耗掉了。如果宽度参数是负值,结果会在长度为abs
(width
)的域中被左对齐(如果-
标志被指定)。
type
(必需)格式转换的类型,用于产生格式说明符的输出。支持下面的类型:
s
将参数值格式化为一个简单字符串。一个控制被视为一个空字符串。I
将参数值视作 SQL 标识符,并在必要时用双写引号包围它。如果参数为空,将会是一个错误(等效于quote_ident
)。L
将参数值引用为 SQL 文字。一个空值将被显示为不带引号的字符串NULL
(等效于quote_nullable
)。
除了以上所述的格式说明符之外,要输出一个文字形式的%
字符,可以使用特殊序列%%
。
下面有一些基本的格式转换的例子:
SELECT format('Hello %s', 'World');
结果:Hello World
SELECT format('Testing %s, %s, %s, %%', 'one', 'two', 'three');
结果:Testing one, two, three, %
SELECT format('INSERT INTO %I VALUES(%L)', 'Foo bar', E'O\'Reilly');
结果:INSERT INTO "Foo bar" VALUES('O''Reilly')
SELECT format('INSERT INTO %I VALUES(%L)', 'locations', 'C:\Program Files');
结果:INSERT INTO locations VALUES(E'C:\\Program Files')
下面是使用width
域和-
标志的例子:
SELECT format('|%10s|', 'foo');
结果:| foo|
SELECT format('|%-10s|', 'foo');
结果:|foo |
SELECT format('|%*s|', 10, 'foo');
结果:| foo|
SELECT format('|%*s|', -10, 'foo');
结果:|foo |
SELECT format('|%-*s|', 10, 'foo');
结果:|foo |
SELECT format('|%-*s|', -10, 'foo');
结果:|foo |
这些例子展示了position
域的例子:
SELECT format('Testing %3$s, %2$s, %1$s', 'one', 'two', 'three');
结果:Testing three, two, one
SELECT format('|%*2$s|', 'foo', 10, 'bar');
结果:| bar|
SELECT format('|%1$*2$s|', 'foo', 10, 'bar');
结果:| foo|
不同于标准的 C 函数sprintf
,本数据库的format
函数允许将带有或者不带有position
域的格式说明符被混在同一个格式字符串中。一个不带有position
域的格式说明符总是使用最后一个被消耗的参数的下一个参数。另外,format
函数不要求所有函数参数都被用在格式字符串中。例如:
SELECT format('Testing %3$s, %2$s, %s', 'one', 'two', 'three');
结果:Testing three, two, three
对于安全地构造动态 SQL 语句,%I
和%L
格式说明符特别有用。
NLS_UPPER
描述
该函数将字符串中英文字母全部转为大写。
语法
NLS_UPPER(char [, 'nlsparam' ])
参数
参数 | 说明 |
char | 指定要转换的字符串。字符串类型可为 |
返回类型
返回与char
相同的类型数据。
示例
select NLS_UPPER('aaa BBB CcC') FROM DUAL;
nls_upper
-------------
AAA BBB CCC
NLSSORT
描述
该函数用于返回排序之后的字符串。
语法
NLSSORT(char [, 'nlsparam' ])
参数
参数 | 说明 |
char | 指定要排序的字符串。字符串类型可为 |
nlsparam | 指定返回字符串的排序方式,为可选项。 |
返回类型
返回与c
相同的类型数据。
示例
CREATE TABLE test (name VARCHAR2(15));
INSERT INTO test VALUES ('ccc');
INSERT INTO test VALUES ('bbb');
INSERT INTO test VALUES ('aaa');
SELECT * FROM test ORDER BY name;
name
-----------
Gaardiner
Gaasten
Gaberd
SELECT * FROM test ORDER BY NLSSORT(name, 'NLS_SORT = Danish');
name
-----------
Gaberd
Gaardiner
Gaasten
REGEXP_INSTR
描述
该函数作用是返回正则表达式匹配值在源字符串中的位置。
语法
REGEXP_INSTR (source_char, pattern[, position[, occurrence[, return_opt[, match_param[, subexpr]]]]])
参数
参数 | 说明 |
source_char | 指定用作搜索值的字符表达式,数据类型可为 |
pattern | 指定正则表达式截取规则。它通常是一个文本文字,字符类型可为 |
position | 指定开始正则表达式匹配的起始位置,取值是一个正整数,为可选项。默认值是 1,表示从第一个字符开始搜索 |
occurrence | 指定 |
return_opt | 指定返回出现匹配值位置选项,为可选项。默认值为
|
match_param | 指定更改正则表达式默认匹配方式,为可选项。是数据类型
|
subexpr |
|
返回类型
返回NUMBER
类型数据
示例
SELECT regexp_instr('abcdefghi', 'd.f') FROM DUAL;
regexp_instr
--------------
4
INSTR
描述
该函数在一个字符串中搜索指定的字符,返回发现指定的字符的位置。多字节字符(汉字、全角符等)按 1 个字符计算。
语法
INSTR(char1,char2[,i[,j]])
参数
参数 | 说明 |
char1 | 被搜索的字符串。字符串类型可以为 |
char2 | 指定要搜索的字符串。字符串类型可以为 |
i | 搜索的开始位置,默认值为 |
j |
|
返回类型
返回NUMBER
类型数据
示例
SELECT INSTR('PolarDB-PG','P',1,2) "INSTR" FROM DUAL;
INSTR
-------
9
TRIM
描述
该函数用来删除一个字符串的开头或结尾(或两者)的字符。
trim_character
和trim_source
都可以是VARCHAR2
或任何可以隐式转换为 VARCHAR2
的数据类型。如果函数返回值的数据类型为VARCHAR2
,则该值的最大长度为trim_source
。
语法
TRIM([{{ LEADING | TRAILING | BOTH }[ trim_character ]|trim_character }FROM] trim_source)
参数
参数 | 说明 |
LEADING | TRAILING | BOTH | 指定删除字符的位置。
|
trim_character | 删除的字符,只能是单个字符。 如果未指定 |
trim_source | 需要被删除字符的字符串。 如果仅指定 |
返回类型
如果
trim_source
为CHAR
、VARCHAR2
数据类型,则函数返回VARCHAR2
数据类型。如果
trim_source
为NCHAR
、NVARCHAR2
数据类型,则函数返回NVARCHAR2
数据类型。如果
trim_source
为CLOB
数据类型,则函数返回CLOB
数据类型。如果
trim_source
或trim_character
为NULL
,则TRIM
函数返回NULL
。
示例
SELECT trim(both 'x' from 'x!@#$x') FROM DUAL;
btrim
-------
!@#$
TREAT
描述
该函数用于更改表达式的声明类型,必须对类型具有EXECUTE对象权限才能使用此函数。
类型必须是已声明的expr类型的某个超类型或子类型。如果最具体的expr类型是type(或某个子类型),则TREAT返回expr。如果expr的最特定类型不是类型(或某个类型的子类型),则TREAT返回NULL。
只有当声明的expr类型为REF类型时,才能指定REF。
如果声明的expr类型是expr源类型的REF,则类型必须是expr的源类型的某个子类型或超类型。如果DEREF(expr)的最特定类型是类型(或类型的子类型),则TREAT返回expr。如果DEREF(expr)的最特定类型不是类型(或类型的子类型),则TREAT返回NULL。
此函数不直接支持CLOB数据。但是,CLOB可以通过隐式数据转换作为参数传入。
语法
TREAT( expr AS [ REF ] [ schema. ]type)
参数
参数 | 说明 |
expr | 字符串类型可为 |
REF | 可选,指定的REF,只有在expr为REF类型时才可以指定 |
schema | 可选,指定type的schema |
type | 指定的声明类型 |
返回类型
返回char
类型数据
示例
SELECT name, TREAT(VALUE(p) AS employee_t).salary salary FROM persons p;
NAME SALARY
------------------------- ----------
Bob
Joe 100000
Tim 1000
SOUNDEX
描述
该函数用于返回包含char的发音表示的字符串,使用此功能可以获取英语中拼写不同但发音相似的单词。
语法
SOUNDEX(char)
参数
参数 | 说明 |
char | 字符串类型可为 |
返回类型
返回char
类型数据
示例
create table test(c varchar(100));
insert into test values('Smith');
select c from test where SOUNDEX(c) = SOUNDEX('SMYTHE');
c
-------
Smith
REGEEXP_SUBSTR
描述
该函数允许使用正则表达式搜索字符串并返回匹配字符串,扩展了 SUBSTR
函数的功能。 该函数类似于 REGEXP_INSTR
,但它不返回子字符串的位置,而是返回子字符串。如果仅需要匹配字符串的内容,但不需要返回其在源字符串中的位置,则此函数很适用。
语法
REGEXP_SUBSTR(source_char, pattern
[, position [, occurrence [, match_param [, subexpr] ] ] ]
)
参数
参数 | 说明 |
source_char | 指定用作搜索值的字符表达式,数据类型可以为 |
pattern | 指定正则表达式截取规则。它通常是一个文本字面量,字符类型可以为 |
position | 指定开始正则表达式匹配的起始位置,取值是一个正整数,为可选项。默认值是1,表示从第一个字符开始搜索 |
occurrence | 指定 |
match_param | 指定更改正则表达式默认匹配方式,为可选项。是数据类型
|
subexpr | 指示 |
返回类型
返回与参数source_char
相同的 VARCHAR2
或 CLOB
数据类型。
示例
SELECT REGEXP_SUBSTR('500 Oracle Parkway, Redwood Shores, CA',',[^,]+,') "REGEXPR_SUBSTR" FROM DUAL;
REGEXPR_SUBSTR
-------------------
, Redwood Shores,
SELECT REGEXP_SUBSTR('http://www.oracle.com/products','http://([[:alnum:]]+\.?){3,4}/?') "REGEXP_SUBSTR" FROM DUAL;
REGEXP_SUBSTR
------------------------
http://www.oracle.com/
NLS_LOWER
描述
该函数将字符串中英文字母全部转为小写。
语法
NLS_LOWER(char [, 'nlsparam' ])
参数
参数 | 说明 |
char | 指定要转换的字符串。字符串类型可为 |
返回类型
返回与char
相同的类型数据。
示例
select NLS_LOWER('aaa BBB CcC') FROM DUAL;
nls_lower
-------------
aaa bbb ccc
NLS_INTCAP
描述
该函数返回字符串并将字符串中每个单词的首字母大写,其他字母小写。单词由空格或非字母数字字符分隔。
语法
NLS_INITCAP(c)
参数
参数 | 说明 |
c | 字符串类型可为 |
返回类型
返回char
类型数据
示例
select INITCAP('aaa BBB CcC') FROM DUAL;
initcap
-------------
Aaa Bbb Ccc