全部产品
云市场

基本元素

更新时间:2019-09-18 01:16:17

数据类型

OceanBase支持如下数据类型,与Oracle数据类型保持一致:

  • 数值类型

  • 日期时间类型

  • 文本类型

数值类型

数值类型可以划分为三类:

  • 整数类型:SMALLINT/INT/INTEGER

  • 定点类型:DECIMAL/NUMERIC/NUMBER

  • 浮点类型:FLOAT/BINARY_FLOAT/BINARY_DOUBLE

其中,浮点类型暂不支持。

整数类型

整数类型不需要指定precision和scale,内部实现等价于NUMBER(38),即只能精确38位整数。

整数类型为定长、精确数值类型,值域取决于类型长度。以下为相关信息:

类型 长度(字节) 值域
SMALLINT/INT/INTEGER 1~21 [-10^39 + 1 , 10^39 - 1 ]

定点类型

定点类型为变长、精确数值类型,值域和精度取决于precision和scale。precision和scale分别表示十进制下的总最大有效位数、小数部分最大有效位数,整数部分最大有效位数等于precision - scale。其中precision的取值范围为[1, 38],默认值为38;scale取值范围[-84, 127],默认值为0。例如:

  • NUMBER(5, 2),整数部分和小数部分最大有效位数分别为3、2,所以值域为[-999.99, 999.99]。

DECIMAL/NUMERIC等ANSI数据类型等价于NUMBER

日期时间类型

以下为相关信息:

类型 格式 下界 上界 含义
DATE YYYY-MM-DD HH24:MI:SS 0001-01-01 00:00:00 9999-12-31 23:59:59 时间, 精确到秒(不考虑时区)
TIMESTAMP [(scale)] YYYY-MM-DD HH24:MI:SS.FF 0001-01-01 00:00:00.000000000 9999-12-31 23:59:59.999999999 时间, 精确到纳秒(不考虑时区)
TIMESTAMP [(scale)] WITH TIME ZONE YYYY-MM-DD HH24:MI:SS.FF TZR TZD 0001-01-01 00:00:00.000000000 xx 9999-12-31 23:59:59.999999999 xx 时间,带时区信息
TIMESTAMP [(scale)] WITH LOCAL TIME ZONE YYYY-MM-DD HH24:MI:SS.FF 0001-01-01 00:00:00.000000000 9999-12-31 23:59:59.999999999 时间,使用SESSION TIMEZONE时区信息

TIMESTAMP [(scale)]TIMESTAMP [(scale)] WITH TIME ZONETIMESTAMP [(scale)] WITH LOCAL TIME ZONE的值域和精度取决于scale。该属性表示小数部分最大有效位数,最大值为9,最小值为0,默认值为6。

其中,时间类型的格式受系统变量NLS_DATE_FORMAT/NLS_TIMESTAMP_FORMAT/NLS_TIMESTAMP_TZ_FORMAT控制。

文本类型

以下为普通文本类型相关信息:

类型 长度 定义长度上限(字符) 字符集
`CHAR (n [char byte])` 定长 2000 UTF8MB4
`VARCHAR2 (n [char byte])` 变长 4000 UTF8MB4
RAW 变长 2000 BINARY

其中,CHAR/VARCHAR2类型需要指定length语义,默认值受系统变量NLS_LENGTH_SEMANTICS控制。

以下为大对象类型相关信息:

类型 长度 存储长度上限(字节) 字符集
CLOB 变长 48M UTF8MB4
BLOB 变长 48M BINARY

表达式

表达式是广义概念,通常有若干个输入参数,并且返回一个输出结果。其中输入参数可能来自于常量或单行数据,也可能来自于多行数据。表达式可以组合,一个表达式的输入可以为另一个表达式的输出。

根据表达式的来源和形式,可分为如下几类:

  • 列引用。
  • 常量。
  • 运算符。
  • 函数。

例如:

  1. SELECT ABS(a + 1)
  2. FROM t1
  3. WHERE a > 0;
  • a为列引用。
  • 0、1为常量。
  • >+为运算符,以0、1、a表达式为输入,需要注意>等判断运算符在Oracle Mode下为条件表达式。
  • ABS为函数,以+表达式为输入。

类型转换

OceanBase支持显式类型转换和隐式类型转换。

显示类型转换通过CAST函数实现。

隐式类型转换发生在这样的场景中:一个操作需要一个指定类型的参数,但语句的实际参数值并不是指定类型,这时OceanBase会将实际参数值转为指定类型后,再进行后续操作。

字符集

目前只支持如下字符集:

  • UTF8MB4:变长编码,字符最大长度4字节。
  • BINARY:定长编码,字符固定长度1字节。

UT8/UTF8MB3UTF8MB4的子集,变长编码,字符最大长度3字节。为支持无缝迁移,OceanBase在语法上将UTF8视为UTF8MB4的同义词。

排序规则

目前只支持如下排序规则:

  • UTF8MB4UTF8MB4_GENERAL_CI

  • UTF8MB4UTF8MB4_BIN

  • BINARYBINARY

数据比较规则

OceanBase允许任意两或多个任意类型的数据进行比较,比较结果可能为:

  • 非0 / TRUE
  • 0 / FALSE。
  • NULL。

如果参与比较的数据类型不一致,OceanBase会根据相关规则确定一个用于比较的数据类型,逻辑上所有参与比较的数据都需要先转换为该数据类型才能参与比较操作。

如果比较类型为文本类型,则还需要确定一个用于比较的排序规则。

字面量

文本

文本是使用单引号'或双引号"引起来的字符序列,如果打开ANSI_QUOTES模式,那只有单引号'可以用于引用字符串。

数值

十进制数值可以分为精确数值(整数和定点数值)和浮点数值。数值可以使用小数点.作为十进制分隔符,也可以在前面加一个负号-来表示负值。

十六进制数值只支持整数数值,以前缀0X开始,允许出现字母AF,所有字母不区分大小写。

日期时间

日期时间字面量有文本或数值两种形式。

  • 文本格式可使用全量分隔符:'2015-07-21 12:34:56.789',或完全不使用分隔符:'20150721'
  • 文本格式可以使用 TIMESTAMP 或者 DATE 指定目标类型,如 TIMESTAMP'2015-07-21 12:34:56.789'
  • 数值格式只允许使用小数点.作为秒和微秒部分的分隔符:20150721123456.789
  • 在需要使用分隔符时,除了秒和微秒部分之间只能使用小数点.外,其它分隔符建议只使用-/:等常用分隔符。

转义字符

转义字符是在字符串中,某些序列前添加反斜线\,用于表示特殊含义。转义字符对大小写敏感。例如\b表示退格,但\B表示B

以下为所有转义符列表:

转义符 含义
\b 退格符。
\f 换页符。
\n 换行符。
\r 回车符。
\t tab字符。
\\ 反斜线字符。
\' 单引号。
\" 双引号。
\_ 下划线。
\% 百分号。
\0 NULL。
\Z ASCII 26,控制符Ctrl+Z。

注释

SQL语句

在普通SQL语句中,OceanBase支持如下3种注释方法:

  • --到行尾。
  • /**/

数据库对象

在DDL语句中通过COMMENT子句可以位数据库对象指定注释。例如:

COMMENT ON COLUMN t.c1 IS ‘comment on this column’;

COMMENT ON TABLE t IS ‘comment on this table’;