如何使用ALTERTABLE修改表_云原生大数据计算服务 MaxCompute(MaxCompute)-阿里云帮助中心

修改表的所有人

修改表的所有人，即表Owner。

命令格式

alter table <table_name> changeowner to <new_owner>;

参数说明
- table_name：必填。待修改Owner的表名。
- new_owner：必填。修改后的Owner账号。

使用示例

--将表test1的所有人修改为ALIYUN$xxx@aliyun.com。
alter table test1 changeowner to 'ALIYUN$xxx@aliyun.com';

修改表的注释

修改表的注释内容。

命令格式

alter table <table_name> set comment '<new_comment>';

参数说明
- table_name：必填。待修改注释的表的名称。
- new_comment：必填。修改后的注释名称。
使用示例
```
alter table sale_detail set comment 'new coments for table sale_detail';
```
您可以通过MaxCompute的desc table_name命令查看表中comment的修改结果。

修改表的修改时间

MaxCompute SQL提供touch操作用来修改表的LastModifiedTime，可将表的LastModifiedTime修改为当前时间。此操作会改变表的LastModifiedTime的值，MaxCompute会认为表的数据有变动，生命周期的计算会重新开始。

命令格式
```
alter table <table_name> touch;
```
参数说明
table_name：必填。待修改表的修改时间的表名称。
使用示例
```
alter table sale_detail touch;
```

修改表的聚簇属性

对于分区表，MaxCompute支持通过alter table语句增加或者去除聚簇属性。

命令格式
- 增加表的Hash聚簇属性的语法格式如下：
```
alter table <table_name> [clustered by (<col_name> [, <col_name>, ...]) [sorted by (<col_name> [asc | desc] [, <col_name> [asc | desc] ...])] into <number_of_buckets> buckets];
```
- 去除表的Hash聚簇属性的语法格式如下：
```
alter table <table_name> not clustered;
```
- 增加表的Range聚簇属性，Bucket数不是必须的，可以省略，此时系统会根据数据量自动决定最佳的Bucket数目。语法格式如下：
```
alter table <table_name> [range clustered by (<col_name> [, <col_name>, ...]) [sorted by (<col_name> [asc | desc] [, <col_name> [asc | desc] ...])] into <number_of_buckets> buckets];
```
- 去除表或分区的Range聚簇属性的语法格式如下：
```
alter table <table_name> not clustered;
alter table <table_name> partition [<pt_spec>] not clustered;
```
  说明
  - 通过alter table改变聚簇属性，只对分区表有效，非分区表一旦建立聚簇属性就无法改变。alter table语句适用于存量表，在增加了新的聚簇属性后，新的分区将按设置的聚簇属性存储。
  - alter table只会影响分区表的新建分区（包括insert overwrite生成的），新分区将按新的聚簇属性存储，老数据分区的聚簇属性和存储保持不变。即在一张曾经做过聚簇属性设置的表上，关闭了聚簇属性，再增加聚簇设置，可以在新分区设置不同于之前的聚簇列、排序列及分桶数。
  - 由于alter table只影响新分区，所以该语句不可以再指定分区。
参数说明
详情请参见CREATE TABLE。

使用示例

-- 创建一个分区表
create table if not exists sale_detail(
 shop_name     STRING,
 customer_id   STRING,
 total_price   DOUBLE)
partitioned by (sale_date STRING, region STRING);

-- 修改表格的cluster属性
alter table sale_detail clustered by (customer_id) sorted by (customer_id) into 10 buckets;

更多关于cluster属性的介绍请参见Hash Clustering、Range Clustering。

重命名表

重命名表的名称。仅修改表的名字，不改动表中的数据。

命令格式

alter table <table_name> rename to <new_table_name>;

参数说明
- table_name：必填。待修改名称的表。
- new_table_name：必填。修改后的表名称。如果已存在与new_table_name同名的表，会返回报错。

使用示例

alter table sale_detail rename to sale_detail_rename;

修改表的生命周期

修改已存在的分区表或非分区表的生命周期。

命令格式

alter table <table_name> set lifecycle <days>;

参数说明
- table_name：必填。需要修改生命周期的表名。
- days：必填。修改后的生命周期时间，只能为正整数，单位为天。

使用示例

--修改test_lifecycle表，将生命周期设为50天。
alter table test_lifecycle set lifecycle 50;

禁止或恢复生命周期

禁止或恢复指定表或分区的生命周期。

命令格式

alter table <table_name> partition [<pt_spec>] {enable|disable} lifecycle;

参数说明
- table_name：必填。待禁止或恢复生命周期的表的名称。
- pt_spec：可选。待禁止或恢复生命周期的表的分区信息。格式为partition_col1=col1_value1, partition_col2=col2_value1...。对于有多级分区的表，必须指明全部的分区值。
- enable：恢复表或指定分区的生命周期功能。
  - 表及其分区重新参与生命周期回收，默认使用当前表及分区上的生命周期配置。
  - 开启表生命周期前可以修改表及分区的生命周期配置，防止开启表生命周期后因使用之前的配置导致数据被误回收。
- disable：禁止表或指定分区的生命周期功能。
  - 禁止表本身及其所有分区被生命周期回收，优先级高于恢复表分区生命周期。即当使用table disable lifecycle时，pt_spec enable lifecycle设置无效。
  - 禁止表的生命周期功能后，表的生命周期配置及其分区的enable和disable标记会被保留。
  - 禁止表的生命周期功能后，仍然可以修改表及分区的生命周期配置。
使用示例
- 示例1：禁止表trans的生命周期功能。
```
alter table trans disable lifecycle;
```
- 示例2：禁止表trans中时间为20141111分区的生命周期功能。
```
alter table trans partition (dt='20141111') disable lifecycle;
```

添加分区

为已存在的分区表新增分区。

限制条件
- MaxCompute单表支持的分区数量上限为6万个。
- 对于有多级分区的表，如果需要添加新的分区值，必须指明全部的分区。
- 仅支持新增分区值，不支持新增分区字段。

命令格式

alter table <table_name> add [if not exists] partition <pt_spec> [partition <pt_spec> partition <pt_spec>...];

参数说明
- table_name：必填。待新增分区的分区表名称。
- if not exists：可选。如果未指定if not exists而同名的分区已存在，会执行失败并返回报错。
- pt_spec：必填。新增的分区，格式为(partition_col1 = partition_col_value1, partition_col2 = partition_col_value2, ...)。partition_col是分区字段，partition_col_value是分区值。分区字段不区分大小写，分区值区分大小写。
使用示例
- 示例1：给表sale_detail添加一个分区，用来存储2013年12月杭州地区的销售记录。
```
alter table sale_detail add if not exists partition (sale_date='201312', region='hangzhou');
```
- 示例2：给表sale_detail同时添加两个分区，用来存储2013年12月北京和上海地区的销售记录。
```
alter table sale_detail add if not exists partition (sale_date='201312', region='beijing') partition (sale_date='201312', region='shanghai');
```
- 示例3：给表sale_detail添加分区，仅指定一个分区字段sale_date，返回报错，需要同时指定2个分区字段sale_date和region。
```
alter table sale_detail add if not exists partition (sale_date='20111011');
```

删除分区

为已存在的分区表删除分区。

MaxCompute支持通过条件筛选方式删除分区。如果您希望一次性删除符合某个规则条件的多个分区，可以使用表达式指定筛选条件，通过筛选条件匹配分区并批量删除分区。

限制条件
- 每个分区过滤子句只能访问一个分区列。
- 表达式用到的函数必须是内建的Scalar函数。
注意事项
- 删除分区之后，MaxCompute项目的存储量会降低。
- 您可以结合MaxCompute提供的生命周期功能，实现自动回收旧分区的能力。更多生命周期信息，请参见生命周期。

命令格式

未指定筛选条件

--一次删除一个分区。
alter table <table_name> drop [if exists] partition <pt_spec>;
--一次删除多个分区。
alter table <table_name> drop [if exists] partition <pt_spec>,partition <pt_spec>[,partition <pt_spec>....];

指定筛选条件

alter table <table_name> drop [if exists] partition <partition_filtercondition>;

参数说明
- table_name：必填。待删除分区的分区表名称。
- if exists：可选。如果未指定if exists且分区不存在，则返回报错。
- pt_spec：必填。删除的分区。格式为(partition_col1 = partition_col_value1, partition_col2 = partition_col_value2, ...)。partition_col是分区字段，partition_col_value是分区值。分区字段不区分大小写，分区值区分大小写。
- partition_filtercondition：指定筛选条件时必填。分区筛选条件，不区分大小写。格式为：
```
partition_filtercondition
    : partition (<partition_col> <relational_operators> <partition_col_value>)
    | partition (scalar(<partition_col>) <relational_operators> <partition_col_value>)
    | partition (<partition_filtercondition1> AND|OR <partition_filtercondition2>)
    | partition (NOT <partition_filtercondition>)
    | partition (<partition_filtercondition1>)[,partition (<partition_filtercondition2>), ...]
```
  - partition_col：分区名称。
  - relational_operators：关系运算符，详情请参见运算符。
  - partition_col_value：分区列比较值或正则表达式，与分区列数据类型保持一致。
  - scalar()：Scalar函数。Scalar函数基于输入值生成对应的标量，对分区列的值（partition_col）进行处理后再按照指定的关系运算符relational_operators与partition_col_value做比较。
  - 分区过滤条件支持逻辑运算符NOT、AND和OR。支持通过NOT过滤条件子句，取过滤规则的补集。支持多个过滤条件子句以AND或OR的关系组成整体分区匹配规则。
  - 支持多个分区过滤子句，当多个分区过滤子句以英文逗号（,）分隔时，每个过滤子句的逻辑以OR的关系组成整体分区匹配规则。

使用示例

未指定筛选条件

--从表sale_detail中删除一个分区，2013年12月杭州分区的销售记录。
alter table sale_detail drop if exists partition(sale_date='201312',region='hangzhou'); 
--从表sale_detail中同时删除两个分区，2013年12月杭州和上海分区的销售记录。
alter table sale_detail drop if exists partition(sale_date='201312',region='hangzhou'),partition(sale_date='201312',region='shanghai');

指定筛选条件

--创建分区表。
create table if not exists sale_detail(
shop_name     STRING,
customer_id   STRING,
total_price   DOUBLE)
partitioned by (sale_date STRING);
--添加分区。
alter table sale_detail add if not exists
partition (sale_date= '201910')
partition (sale_date= '201911')
partition (sale_date= '201912')
partition (sale_date= '202001')
partition (sale_date= '202002')
partition (sale_date= '202003')
partition (sale_date= '202004')
partition (sale_date= '202005')
partition (sale_date= '202006')
partition (sale_date= '202007');
--批量删除分区。
alter table sale_detail drop if exists partition(sale_date < '201911');
alter table sale_detail drop if exists partition(sale_date >= '202007');
alter table sale_detail drop if exists partition(sale_date LIKE '20191%');
alter table sale_detail drop if exists partition(sale_date IN ('202002','202004','202006'));
alter table sale_detail drop if exists partition(sale_date BETWEEN '202001' AND '202007');
alter table sale_detail drop if exists partition(substr(sale_date, 1, 4) = '2020');
alter table sale_detail drop if exists partition(sale_date < '201912' OR sale_date >= '202006');
alter table sale_detail drop if exists partition(sale_date > '201912' AND sale_date <= '202004');
alter table sale_detail drop if exists partition(NOT sale_date > '202004');
--支持多个分区过滤表达式，表达式之间是OR的关系。
alter table sale_detail drop if exists partition(sale_date < '201911'), partition(sale_date >= '202007');
--添加其他格式分区。
alter table sale_detail add IF NOT EXISTS
partition (sale_date= '2019-10-05') 
partition (sale_date= '2019-10-06') 
partition (sale_date= '2019-10-07');
--批量删除分区，使用正则表达式匹配分区。
alter table sale_detail drop if exists partition(sale_date RLIKE '2019-\\d+-\\d+');
--创建多级分区表。
create table if not exists region_sale_detail(
shop_name     STRING,
customer_id   STRING,
total_price   DOUBLE)
partitioned by (sale_date STRING , region STRING );
--添加分区。
alter table region_sale_detail add IF NOT EXISTS
partition (sale_date= '201910',region = 'shanghai')
partition (sale_date= '201911',region = 'shanghai')
partition (sale_date= '201912',region = 'shanghai')
partition (sale_date= '202001',region = 'shanghai')
partition (sale_date= '202002',region = 'shanghai')
partition (sale_date= '201910',region = 'beijing')
partition (sale_date= '201911',region = 'beijing')
partition (sale_date= '201912',region = 'beijing')
partition (sale_date= '202001',region = 'beijing')
partition (sale_date= '202002',region = 'beijing');
--执行如下语句批量删除多级分区，两个匹配条件是或的关系，会将sale_date小于201911或region等于beijing的分区都删除掉。
alter table region_sale_detail drop if exists partition(sale_date < '201911'),partition(region = 'beijing');
--如果删除sale_date小于201911且region等于beijing的分区，可以使用如下方法。
alter table region_sale_detail drop if exists partition(sale_date < '201911', region = 'beijing');

批量删除多级分区时，在一个partition过滤子句中，不能根据多个分区列编写组合条件匹配分区，如下语句会报错FAILED: ODPS-0130071:[1,82] Semantic analysis exception - invalid column reference region, partition expression must have one and only one column reference。

--分区过滤子句只能访问一个分区列，如下语句报错。
alter table region_sale_detail drop if exists partition(sale_date < '201911' AND region = 'beijing');

修改分区的更新时间

MaxCompute SQL提供touch操作，用于修改分区表中分区的LastModifiedTime。此操作会将LastModifiedTime修改为当前时间。此时，MaxCompute会认为数据有变动，重新计算生命周期。

使用限制
对于有多级分区的表，必须指明全部的分区。

命令格式

alter table <table_name> touch partition (<pt_spec>);

参数说明
- table_name：必填。待修改分区更新时间的分区表名称。如果表不存在，则返回报错。
- pt_spec：必填。需要修改更新时间的分区信息。格式为(partition_col1 = partition_col_value1, partition_col2 = partition_col_value2, ...)。partition_col是分区字段，partition_col_value是分区值。如果指定的分区字段或分区值不存在，则返回报错。

使用示例

--修改表sale_detail的分区sale_date='201312', region='shanghai'的LastModifiedTime。
alter table sale_detail touch partition (sale_date='201312', region='shanghai');

修改分区值

MaxCompute SQL支持通过rename操作更改分区表的分区值。

使用限制
- 不支持修改分区列的列名，只能修改分区列对应的值。
- 对于有多级分区的表，必须指明全部的分区。

命令格式

alter table <table_name> partition (<pt_spec>) rename to partition (<new_pt_spec>);

参数说明
- table_name：必填。待修改分区值的表名称。
- pt_spec：必填。需要修改分区值的分区信息。格式为(partition_col1 = partition_col_value1, partition_col2 = partition_col_value2, ...)。partition_col是分区字段，partition_col_value是分区值。如果指定的分区字段或分区值不存在，则返回报错。
- new_pt_spec：必填。修改后的分区信息。格式为(partition_col1 = new_partition_col_value1, partition_col2 = new_partition_col_value2, ...)。partition_col是分区字段，new_partition_col_value是新分区值。

使用示例

--修改表sale_detail的分区值。
alter table sale_detail partition (sale_date = '201312', region = 'hangzhou') rename to partition (sale_date = '201310', region = 'beijing');

合并分区

MaxCompute SQL提供merge partition对分区表的分区进行合并，即将同一个分区表下的多个分区合并成一个分区，同时删除被合并的分区维度的信息，把数据移动到指定分区。

使用限制
- 不支持外部表，聚簇表合并后的分区会消除聚簇属性。
- 一次性合并分区数量限制为4000个。

命令格式

alter table <table_name> merge [if exists] partition (<predicate>) [, partition(<predicate2>) ...] overwrite partition (<fullpartitionSpec>) [purge];

参数说明
- table_name：必填。待合并分区的分区表名称。
- if exists：可选。如果未指定if exists，且分区不存在，会执行失败并返回报错。如果指定if exists后不存在满足merge条件的分区，则不生成新分区。如果运行过程中出现源数据被并发修改（包括insert、rename或drop）时，即使指定if exists也会报错。
- predicate：必填。筛选待合并分区需要满足的条件。
- fullpartitionSpec：必填。目标分区信息。
- purge：可选关键字。选择该字段，则会清理session目录，默认清理3天内的日志。详情请参见Purge。

使用示例

示例1：合并满足指定条件的分区到目标分区。

--查看分区表的分区。
show partitions intpstringstringstring;

ds=20181101/hh=00/mm=00
ds=20181101/hh=00/mm=10
ds=20181101/hh=10/mm=00
ds=20181101/hh=10/mm=10

--合并所有满足hh='00'的分区到hh='00'，mm='00'中。
alter table intpstringstringstring merge partition(hh='00') overwrite partition(ds='20181101', hh='00', mm='00');

--查看合并后的分区。
show partitions intpstringstringstring;

ds=20181101/hh=00/mm=00
ds=20181101/hh=10/mm=00
ds=20181101/hh=10/mm=10

示例2：合并指定的多个分区到目标分区。

--合并多个指定分区。
alter table intpstringstringstring merge if exists partition(ds='20181101', hh='00', mm='00'), partition(ds='20181101', hh='10', mm='00'),  partition(ds='20181101', hh='10', mm='10') overwrite partition(ds='20181101', hh='00', mm='00') purge;
--查看分区表的分区。
show partitions intpstringstringstring;

ds=20181101/hh=00/mm=00

添加列或注释

为已存在的非分区表或分区表添加列或注释。

说明

MaxCompute已支持添加STRUCT类型的列，例如struct<x: string, y: bigint>、map<string, struct<x: double, y: double>>。

命令格式

alter table <table_name> add columns (<col_name1> <type1> comment ['<col_comment>'][, <col_name2> <type2> comment '<col_comment>'...]);

参数说明
- table_name：必填。待新增列的表名称。添加的新列不支持指定顺序，默认在最后一列。
- col_name：必填。新增列的名称。
- type：必填。新增列的数据类型。
- col_comment：可选。新增列的注释。

使用示例

示例1：给表sale_detail添加两个列。

alter table sale_detail add columns (customer_name STRING, education BIGINT);

示例2：给表sale_detail添加两个列并同时添加列注释。

alter table sale_detail add columns (customer_name STRING comment '客户', education BIGINT comment '教育' );

示例3：给表sale_detail添加一个复杂数据类型列。

alter table sale_detail add columns (region struct<province:string, area:string>);

删除列

为已存在的非分区表或分区表删除指定的单个或多个列。

说明

在下列场景中，如果执行了删除列操作，会使表的读写行为发生变化：

作业类型是MapReduce 1.0时，Graph任务无法读写修改的表。
CUPID作业只有Spark以下版本可以读表，但是不可以写表：
- Spark-2.3.0-odps0.34.0
- Spark-3.1.1-odps0.34.0
PAI作业可以读表，但不可以写表。
Hologres作业在1.3版本之前，Hologres引用修改的表作为外部表时，无法读写该表。
表做过删除列操作后，不支持CLONE TABLE。

此外，Streaming Tunnel在写入表时，不可以修改表结构。

命令格式

alter table <table_name> drop columns <col_name1>[, <col_name2>...];

参数说明
- table_name：必填。待删除列的表名称。
- col_name：必填。待删除的列名称。

使用示例

--删除表sale_detail的列customer_id。输入yes确认后，即可删除列。
alter table sale_detail drop columns customer_id;
--删除表sale_detail的列shop_name和customer_id。输入yes确认后，即可删除列。
alter table sale_detail drop columns shop_name, customer_id;

更改列数据类型

为已存在的列更改数据类型。

说明

在下列场景中，如果执行了更改列数据类型操作，会使表的读写行为发生变化：

作业类型是MapReduce 1.0时，Graph任务无法读写修改的表。
CUPID作业只有Spark以下版本可以读表，但是不可以写表：
- Spark-2.3.0-odps0.34.0
- Spark-3.1.1-odps0.34.0
PAI作业可以读表，但不可以写表。
Hologres作业在1.3版本之前，Hologres引用修改的表作为外部表时，无法读写该表。
表做过更改列数据类型操作后，不支持CLONE TABLE。

此外，Streaming Tunnel在写入表时，不可以修改表结构。

命令格式。

alter table <table_name> change [column] <old_column_name> <new_column_name> <new_data_type>;

参数说明。
- table_name：必填。待修改列数据类型的表名称。
- old_column_name：必填。待修改列数据类型的列名称。
- new_column_name：必填。修改列数据类型后的列名称。old_column_name可以与new_column_name保持一致，表示不修改列名称。但是new_column_name不能与除old_column_name之外的列名称相同。
- new_data_type：必填。待修改的列修改后的数据类型。

使用示例。

--将mf_evol_t3表的id字段由int转化为bigint
alter table mf_evol_t3 change id id bigint;
--将mf_evol_t3表的id字段类型由bigint转化为string
alter table mf_evol_t3 change column id id string;

数据类型支持转换表。
说明
Y表示支持转换；N表示不支持转换；-表示不涉及；Y（）表示满足括号内的条件支持转换。

修改列的顺序

为已存在的非分区表或分区表修改列顺序。

说明

在下列场景中，如果执行了更改表的列顺序、添加新列并修改列顺序操作，会使表的读写行为发生变化：

作业类型是MapReduce 1.0时，Graph任务无法读写修改的表。
CUPID作业只有Spark以下版本可以读表，但是不可以写表：
- Spark-2.3.0-odps0.34.0
- Spark-3.1.1-odps0.34.0
PAI作业可以读表，但不可以写表。
Hologres作业在1.3版本之前，Hologres引用修改的表作为外部表时，无法读写该表。
表做过更改表的列顺序操作后，不支持CLONE TABLE。

此外，Streaming Tunnel在写入表时，不可以修改表结构。

命令格式

alter table <table_name> change <old_column_name> <new_column_name> <column_type> after <column_name>;

参数说明
- table_name：必填。待修改列顺序的表名称。
- old_column_name：必填。待修改顺序的列的原始名称。
- new_col_name：必填。修改后的列名称。new_col_name可以与old_column_name保持一致，表示不修改列名称。但new_col_name不能与除old_column_name的之外的列名称相同。
- column_type：必填。待修改的列的原始数据类型。不可修改。
- column_name：必填。将待调整顺序的列调整至column_name之后。

使用示例

--修改表sale_detail的列customer_id为customer并位于total_price之后。
alter table sale_detail change customer_id customer string after total_price;
--修改表sale_detail的列customer_id位于total_price之后，不修改列名称。
alter table sale_detail change customer_id customer_id string after total_price;

修改列名

为已存在的非分区表或分区表修改列名称。

命令格式

alter table <table_name> change column <old_col_name> rename to <new_col_name>;

参数说明
- table_name：必填。待修改列名的表名称。
- old_col_name：必填。待修改的列名称。old_col_name必须是已存在的列。
- new_col_name：必填。修改后的列名称。表中不能有名为new_col_name的列。

使用示例

--修改表sale_detail的列名customer_name为customer。
alter table sale_detail change column customer_name rename to customer;

修改列注释

为已存在的非分区表或分区表修改列注释。

语法格式

alter table <table_name> change column <col_name> comment '<col_comment>';

参数说明
- table_name：必填。待修改列注释的表名称。
- col_name：必填。待修改注释的列名称。col_name必须是已存在的列。
- col_comment：必填。修改后的注释信息。注释内容为长度不超过1024字节的有效字符串，否则报错。

使用示例

--修改表sale_detail的列customer的注释。
alter table sale_detail change column customer comment 'customer';

修改列名及注释

修改非分区表或分区表的列名或注释。

命令格式

alter table <table_name> change column <old_col_name> <new_col_name> <column_type> comment '<col_comment>';

参数说明
- table_name：必填。需要修改列名以及注释的表名称。
- old_col_name：必填。需要修改的列名称。old_col_name必须是已存在的列。
- new_col_name：必填。新的列名称。表中不能有名为new_col_name的列。
- column_type：必填。列的数据类型。
- col_comment：可选。修改后的注释信息。内容最长为1024字节。

使用示例

--修改表sale_detail的列名customer_name为customer_newname，注释“客户”为“customer”。
alter table sale_detail change column customer_name customer_newname STRING comment 'customer';

修改表的列非空属性

修改表的非分区列的非空属性。即如果表的非分区列值禁止为NULL，您可以通过本命令修改分区列值允许为NULL。

您可以通过desc extended table_name;命令查看Nullable属性值，判断列的非空属性。如果Nullable为true，表示允许为NULL；如果Nullable为false，表示禁止为NULL。

使用限制
修改分区列值允许为NULL后，不可回退，不支持再修改分区列值禁止为NULL，请谨慎操作。

命令格式

alter table <table_name> change column <old_col_name> null;

参数说明
- table_name：必填。待修改列非空属性的表名称。
- old_col_name：必填。待修改的非分区列的名称。old_col_name必须是已存在的非分区列。

使用示例

--创建一张分区表，id列禁止为NULL。
create table null_test(id int not null, name string) partitioned by (ds string);
--修改id列允许为NULL。
alter table null_test change column id null;

合并Transactional表文件

Transactional表底层物理存储为不支持直接读取的Base文件和Delta文件。对Transactional表执行update或delete操作，不会修改Base文件，只会追加Delta文件，所以会出现更新或删除次数越多，表实际占用存储越大的情况，多次累积的Delta文件会产生较高的存储和后续查询费用。

对同一表或分区，执行多次update或delete操作，会生成较多Delta文件。系统读数据时，需要加载这些Delta文件来确定哪些行被更新或删除，较多的Delta文件会影响数据读取效率。此时您可以将Base文件和Delta合并，减少存储以便提升数据读取效率。

命令格式

alter table <table_name> [partition (<partition_key> = '<partition_value>' [, ...])] compact {minor|major};

参数说明
- table_name：必填。待合并文件的Transactional表名称。
- partition_key：可选。当Transactional表为分区表时，指定分区列名。
- partition_value：可选。当Transactional表为分区表时，指定分区列名对应的列值。
- major|minor：至少选择其中一个。二者的区别是：
  - minor：只将Base文件及其下所有的Delta文件合并，消除Delta文件。
  - major：不仅将Base文件及其下所有的Delta文件合并，消除Delta文件，还会把表对应的Base文件中的小文件进行合并。当Base文件较小（小于32 MB）或有Delta文件的情况下，等价于重新对表执行insert overwrite操作，但当Base文件足够大（大于等于32 MB ），且不存在Delta文件的情况下，不会重写。

使用示例

示例1：基于Transactional表acid_delete，合并表文件。命令示例如下：

alter table acid_delete compact minor;

返回结果如下：

Summary:
Nothing found to merge, set odps.merge.cross.paths=true if cross path merge is permitted.
OK

示例2：基于Transactional表acid_update_pt，合并表文件。命令示例如下：

alter table acid_update_pt partition (ds = '2019') compact major;

返回结果如下：

Summary:
table name: acid_update_pt /ds=2019  instance count: 2  run time: 6
  before merge, file count:        8  file size: 2613  file physical size: 7839
   after merge, file count:        2  file size: 679  file physical size: 2037

OK

合并小文件

分布式文件系统按块Block存放，文件大小比块大小（64 M）小的文件称之为小文件。分布式系统不可避免会产生小文件，比如SQL或其他分布式引擎计算结果，tunnel数据采集都会产生小文件，小文件合并可以提高计算性能。

命令格式

ALTER TABLE <tablename> [PARTITION(<partition_key>=<partition_value>)] MERGE SMALLFILES;

参数说明
- table_name：必填。待合并文件的表名称。
- partition_key：可选。当表为分区表时，指定分区列名。
- partition_value：可选。当表为分区表时，指定分区列名对应的列值。

使用示例

set odps.merge.cross.paths=true;
set odps.merge.smallfile.filesize.threshold=128;
set odps.merge.max.filenumber.per.instance = 2000;
alter table tbcdm.dwd_tb_log_pv_di partition (ds='20151116') merge smallfiles;

使用合并小文件功能需要用到计算资源，如果您购买的实例是按量计费，会产生相关费用，具体计费规则与SQL按量计费保持一致，详情请参见SQL作业按量计费。

更多详情，请参见合并小文件。

修改表的所有人

修改表的注释

修改表的修改时间

修改表的聚簇属性

重命名表

修改表的生命周期

禁止或恢复生命周期

添加分区

删除分区

修改分区的更新时间

修改分区值

合并分区

添加列或注释

删除列

更改列数据类型

修改列的顺序

修改列名

修改列注释

修改列名及注释

修改表的列非空属性

合并Transactional表文件

合并小文件

相关命令