本文为您介绍本入门教程的准备工作。
创建MaxCompute(ODPS)项目
主流程 | 描述 | 操作指导 |
---|---|---|
准备阿里云账号 | 创建阿里云账号。 | 准备阿里云账号 |
配置AccessKey | 授权主账号的AccessKey至Dataphin。 | 同步RAM用户账号至Dataphin |
创建RAM用户 | 创建主账号的RAM用户。 | 准备RAM用户 |
开通MaxCompute | 购买MaxCompute。 | 开通MaxCompute |
设置计算引擎 | 设置Dataphin的计算引擎为MaxCompute。 | 设置Dataphin实例的计算引擎 |
创建工作空间 | 创建Dataphin的计算源:
|
创建MaxCompute项目 |
开通和配置Dataphin
主流程 | 描述 | 操作指导 |
---|---|---|
开通Dataphin | 购买Dataphin。 | 开通Dataphin |
配置AccessKey | 授权主账号的AccessKey至Dataphin。 | 同步RAM用户账号至Dataphin |
设置计算引擎 | 设置Dataphin的计算引擎为MaxCompute。 | 设置Dataphin实例的计算引擎 |
准备数据源
本入门教程以统计某年办公用品、技术产品两类产品各省份每天的销售总额为例。
- 通过RDS创建MySQL实例,获取RDS实例ID,并在RDS控制台添加白名单,详情请参见创建RDS MySQL实例。本教程中RDS数据源名称以dataphin为例。
说明
- 地域选择华东2(上海)。
- 网络类型选择专有网络。
- 下载本教程中使用的数据表格company_sales_record_copy。
- 上传数据表格company_sales_record_copy至新建的RDS数据源,详情请参见将Excel的数据导入数据库。
注意 如果您的RDS实例中已经有数据表,您也可以不使用company_sales_record_copy数据表。通过执行如下命令查询建表的DDL语句。
后续您可以依据该表的DDL语句,创建同步数据的目标表。如何创建同步数据的目标表,请参见步骤三:引入数据。show create table <table name>;