如果需要向表中插入少量数据,您可以通过insert … values
或values table
操作向数据量小的表中插入数据。
执行insert into
操作前需要具备目标表的修改权限(Alter)及源表的元信息读取权限(Describe)。授权操作请参见权限列表。
本文中的命令您可以在如下工具平台执行:
功能介绍
MaxCompute支持您通过
insert … values
或values table
操作向表中插入少量数据。
功能 | 说明 |
---|---|
insert … values |
在业务测试阶段,您可以通过insert … values 操作向表中插入数据执行简单测试:
|
values table |
如果您需要对插入的数据进行简单的运算,推荐使用MaxCompute的values table 。values table 可以在insert 语句和任何DML语句中使用。功能如下:
|
使用限制
通过insert … values
或values table
操作向表中插入数据时,不支持通过insert overwrite
操作指定插入列,只能通过insert into
操作指定插入列。
命令格式
--insert … values
insert into table <table_name>
[partition (<pt_spec>)][(<col1_name> ,<col2_name>,...)]
values (<col1_value>,<col2_value>,...),(<col1_value>,<col2_value>,...),...
--values table
values (<col1_value>,<col2_value>,...),(<col1_value>,<col2_value>,...),<table_name> (<col1_name> ,<col2_name>,...)...
- table_name:必填。待插入数据的表名称。该表为已经存在的表。
- pt_spec:可选。需要插入数据的目标分区信息,格式为
(partition_col1 = partition_col_value1, partition_col2 = partition_col_value2, ...)
。如果需要更新的表为分区表,您需要指定该参数。 - col_name:可选。需要插入数据的目标列名称。
- col_value:可选。目标表中列对应的列值。多个列值之间用英文逗号(,)分隔。该列值支持常量,同时还支持非常量表达式,例如自定义函数或内建函数表达式。未指定列值时,默认值为NULL。
使用示例
- 示例1:通过
insert … values
操作向特定分区内插入数据。命令示例如下:--创建分区表srcp。 create table if not exists srcp (key string,value bigint) partitioned by (p string); --向分区表srcp添加分区。 alter table srcp add if not exists partition (p='abc'); --向表srcp的指定分区abc中插入数据。 insert into table srcp partition (p='abc') values ('a',1),('b',2),('c',3); --查询表srcp。 select * from srcp where p='abc'; --返回结果。 +------------+------------+------------+ | key | value | p | +------------+------------+------------+ | a | 1 | abc | | b | 2 | abc | | c | 3 | abc | +------------+------------+------------+
- 示例2:通过
insert … values
操作向非特定分区内插入数据。命令示例如下:--创建分区表srcp。 create table if not exists srcp (key string,value bigint) partitioned by (p string); --向表srcp中插入数据,不指定分区。 insert into table srcp partition (p)(key,p) values ('d','20170101'),('e','20170101'),('f','20170101'); --查询表srcp。 select * from srcp where p='20170101'; --返回结果。 +------------+------------+------------+ | key | value | p | +------------+------------+------------+ | d | NULL | 20170101 | | e | NULL | 20170101 | | f | NULL | 20170101 | +------------+------------+------------+
- 示例3:使用复杂数据类型构造常量,通过
insert
操作导入数据。命令示例如下:--创建分区表srcp。 create table if not exists srcp (key string,value array<int>) partitioned by (p string); --向分区表srcp添加分区。 alter table srcp add if not exists partition (p='abc'); --向表srcp的指定分区abc中插入数据。 insert into table srcp partition (p='abc') select 'a', array(1, 2, 3); --查询表srcp。 select * from srcp where p='abc'; --返回结果。 +------------+------------+------------+ | key | value | p | +------------+------------+------------+ | a | [1,2,3] | abc | +------------+------------+------------+
- 示例4:通过
insert … values
操作写入DATETIME或TIMESTAMP数据类型,需要在values
中指定类型名称。命令示例如下:--创建分区表srcp。 create table if not exists srcp (key string, value timestamp) partitioned by (p string); --向分区表srcp添加分区。 alter table srcp add if not exists partition (p='abc'); --向表srcp的指定分区abc中插入数据。 insert into table srcp partition (p='abc') values (datetime'2017-11-11 00:00:00',timestamp'2017-11-11 00:00:00.123456789'); --查询表srcp。 select * from srcp where p='abc'; --返回结果。 +------------+------------+------------+ | key | value | p | +------------+------------+------------+ | 2017-11-11 00:00:00 | 2017-11-11 00:00:00.123 | abc | +------------+------------+------------+
- 示例5:通过
values table
操作插入数据。命令示例如下:--创建分区表srcp。 create table if not exists srcp (key string,value bigint) partitioned by (p string); --向表srcp中插入数据。 insert into table srcp partition (p) select concat(a,b), length(a)+length(b),'20170102' from values ('d',4),('e',5),('f',6) t(a,b); --查询表srcp。 select * from srcp where p='20170102'; --返回结果。 +------------+------------+------------+ | key | value | p | +------------+------------+------------+ | d4 | 2 | 20170102 | | e5 | 2 | 20170102 | | f6 | 2 | 20170102 | +------------+------------+------------+
values (…), (…) t(a, b)
相当于定义了一个名为t
,列为a
和b
,数据类型分别为STRING和BIGINT的表。列的类型需要从values
列表中推导。 - 示例6:取代
select * from
与union all
组合的方式,构造常量表。命令示例如下:select 1 c union all select 2 c; --等价于如下语句。 select * from values (1), (2) t(c); --返回结果。 +------------+ | c | +------------+ | 1 | | 2 | +------------+
- 示例7:通过
values table
的特殊形式插入数据,不带from
子句。命令示例如下:--创建分区表srcp。 create table if not exists srcp (key string,value bigint) partitioned by (p string); --向表srcp中插入数据。 insert into table srcp partition (p) select abs(-1), length('abc'), getdate(); --查询表srcp。 select * from srcp; --返回结果。 +------------+------------+------------+ | key | value | p | +------------+------------+------------+ | 1 | 3 | 2020-11-25 18:39:48 | +------------+------------+------------+
- 示例8:使用非常量表达式,命令示例如下:
返回结果如下:select * from values ('a'),(to_date('20190101', 'yyyyMMdd')),(getdate()) t(d);
+------------+ | d | +------------+ | 2021-02-01 18:01:38 | | 2019-01-01 00:00:00 | | a | +------------+