本文介绍如何通过DataWorks的数据集成与开发将MaxCompute数据迁移至表格存储OTS(Table Store)。
操作步骤
-
开通服务
-
在DataWorks上创建表
-
登录DataWorks控制台,在左上角选择地域。
-
在左侧导航栏选择工作空间。
-
在工作空间列表页面,单击目标工作空间对应的操作列。
-
在Data Studio页面,新建MaxCompute SQL节点。按照如下语句新建表
transs。CREATE TABLE transs (name STRING, id STRING, gender STRING);
-
-
为表
transs导入数据-
下载示例CSV文件至本地demo_data.csv。
-
在左侧导航栏选择。
-
单击进入数据上传与下载。
-
在左侧导航栏单击上传图标
,单击数据上传。将上述本地数据上传至已创建好的MaxCompute表
transs中。
-
-
在表格存储控制台上创建表
-
在DataWorks上新增MaxCompute数据源
-
登录DataWorks控制台,在左上角选择地域。
-
在左侧导航栏选择工作空间。
-
在工作空间列表页面,单击目标工作空间名称。
-
在空间详情页面,单击左侧导航栏数据源。
-
在数据源页签,单击添加数据源,选择MaxCompute。
-
在添加MaxCompute数据源页面,填写基本信息。
详情请参见配置MaxCompute数据源。
-
-
新增OTS数据源,详情请参见配置OTS数据源。
-
配置MaxCompute(ODPS)Reader和表格存储(OTS)Writer
-
登录DataWorks控制台,在左上角选择地域。
-
在左侧导航栏选择。
-
选择工作空间,单击进入Data Studio。
-
在Data Studio左侧,单击
,选择。-
数据来源选择Tablestore。
-
数据去向选择MaxCompute(ODPS)。
-
-
在节点配置页面,填写如下信息。
-
数据源-来源:选择新增的数据源OTS名称。
-
数据源-去向:选择新增的数据源MaxCompute名称。
-
数据来源-表:选择OTS创建的表
-
数据去向-表:已创建MaxCompute表。
-
运行资源:选择创建的独享资源组。
-
其他保持默认即可。
也可以单击配置区域上方的
图标,转换为脚本模式,通过脚本配置。示例如下:{ "type": "job", "steps": [ { "stepType": "odps", "parameter": { "partition": [], "datasource": "odps_first", "column": [ "name", "id", "gender" ], "table": "transs" }, "name": "Reader", "category": "reader" }, { "stepType": "ots", "parameter": { "datasource": "transs", "column": [ { "name": "gender", "type": "STRING" } ], "writeMode": "UpdateRow", "table": "trans", "primaryKey": [ { "name": "name", "type": "STRING" }, { "name": "id", "type": "INT" } ] }, "name": "Writer", "category": "writer" } ], "version": "2.0", "order": { "hops": [ { "from": "Reader", "to": "Writer" } ] }, "setting": { "errorLimit": { "record": "0" }, "speed": { "throttle": false, "concurrent": 1, "dmu": 1 } } } -
-
-
在表格存储控制台中查看新增的表数据。
-
登录表格存储控制台,在左上角选择地域。
-
在左侧导航栏选择全部实例。
-
在全部实例页面下,单击实例名称,进入实例管理页面。
-
在实例管理页面,单击实例详情页签。
-
在实例详情页签下方数据表列表区域,单击要查看的数据表名称。
-
在数据表管理页面,单击数据管理页签,查看新增的表数据。
-