在您完成表格的创建后,就可以使用Tunnel命令导入数据到MaxCompute了。

MaxCompute提供多种数据导入导出方式,本文主要介绍在客户端上使用Tunnel命令操作进行数据导入。

Tunnel命令导入数据

  1. 准备数据
    本文中使用的测试数据为bank.txt,主要用于记录各人员的年龄、工作、房贷等信息。请点击下载数据到您的电脑本地。选取其中前三条数据展示如下。
    44,blue-collar,married,basic.4y,unknown,yes,no,cellular,aug,thu,210,1,999,0,nonexistent,1.4,93.444,-36.1,4.963,5228.1,0
    53,technician,married,unknown,no,no,no,cellular,nov,fri,138,1,999,0,nonexistent,-0.1,93.2,-42,4.021,5195.8,0
    28,management,single,university.degree,no,yes,no,cellular,jun,thu,339,3,6,2,success,-1.7,94.055,-39.8,0.729,4991.6,1

    本文中,bank.txt本地存放路径为D:\

  2. 创建MaxCompute表

    您需要把上面的数据导入到MaxCompute的一张表中,所以需要创建MaxCompute表,如果您已完成步骤一创建bank_data表,可跳过本步骤。

  3. 执行Tunnel命令
    输入表创建成功后,可以在MaxCompute客户端输入Tunnel命令进行数据的导入,如下所示。
    tunnel upload D:\banking.txt bank_data;
    当出现下图中OK字样,说明上传成功。

  4. 结果验证
    执行成功后,您可以使用select count(*) from bank_data;查看表bank_data的记录数,验证是否完成所有数据上传,本文中共有41188条数据。

    说明
    • 有关Tunnel命令的更多详细介绍,例如如何将数据导入分区表等,请参见Tunnel操作
    • 使用Tunnel上传数据如果出现问题,请参考Tunnel命令相关问题

其他导入方式

除了通过客户端导入数据,您也可以使用MaxCompute StudioTunnel SDK数据集成、开源的Sqoop、Fluentd、Flume、LogStash 等工具都可以进行数据导入到MaxCompute,详情请参见数据上传下载-工具介绍

后续步骤

在您的数据导入到MaxCompute后,即可在MaxCompute上运行SQL来处理数据。