表是MaxCompute的数据存储单元。您需要基于表进行数据处理。本文为您介绍如何创建表。
前提条件
- 已登录MaxCompute客户端。
更多登录MaxCompute客户端操作,请参见登录MaxCompute客户端。
- 已准备好保存了待导入数据的CSV或TXT文件。
本文提供的数据文件样例如下:
- 创建非分区表的数据文件:banking.txt。
- 创建分区表的数据文件:banking_nocreditcard.csv、banking_uncreditcard.csv和banking_yescreditcard.csv。
- 如果是RAM用户创建表,请确认阿里云账号已经授予RAM用户创建表的权限(CreateTable)。
更多查看权限操作,请参见查看用户的权限。
更多授权操作,请参见授权。
注意事项
新创建表的列数据类型务必与数据文件的各列数据类型保持一致,如果二者不一致,会导致后续导入数据操作执行失败。
步骤一:设计表
您需要根据待导入的数据内容和最终需要生成的结果数据,确定需要创建的表类型、结构及各列的数据类型。
本文中提供的示例数据内容如下,展示的是银行贷款购房人员的数据。
--待创建非分区表的数据。
44,blue-collar,married,basic.4y,unknown,yes,no,cellular,aug,thu,210,1,999,0,nonexistent,1.4,93.444,-36.1,4.963,5228.1,0
53,technician,married,unknown,no,no,no,cellular,nov,fri,138,1,999,0,nonexistent,-0.1,93.2,-42,4.021,5195.8,0
28,management,single,university.degree,no,yes,no,cellular,jun,thu,339,3,6,2,success,-1.7,94.055,-39.8,0.729,4991.6,1
--待创建分区表的数据。
53,technician,married,unknown,no,no,cellular,nov,fri,138,1,999,0,nonexistent,-0.1,93.2,-42,4.021,5195.8,0
28,management,single,university.degree,yes,no,cellular,jun,thu,339,3,6,2,success,-1.7,94.055,-39.8,0.729,4991.6,1
39,services,married,high.school,no,no,cellular,apr,fri,185,2,999,0,nonexistent,-1.8,93.075,-47.1,1.405,5099.1,0
您可以识别到数据列数、每列数据的数据类型,同时可以了解各列数据对应的含义,为每列数据定义一个列名称。假设基于示例数据,识别到的信息如下。
类型 | 说明 |
---|---|
表的列数 | 从示例数据中识别表列数信息如下:
|
表的列字段 | 从示例数据中识别表列字段信息如下:
|
数据类型 | 从示例数据中识别表列字段的数据类型信息如下:
|
步骤二:创建表
基于示例数据,创建非分区表bank_data和分区表bank_data_pt,用于存储业务数据;创建非分区表result_table1和result_table2,用于存储结果数据。更多表及分区的操作信息,请参见表操作和分区和列操作。创建表的操作流程如下:
步骤三:确认创建结果
创建表后,您需要确认表是否已创建成功,以及表的结构是否正确无误。操作流程如下:
后续步骤
创建表并确认后,即可将数据文件中的数据导入表中,请参见导入数据。