本文为您介绍进行快速入门操作前需进行的准备工作。

使用Dataphin前准备

  1. 请参见准备阿里云账号,完成RAM账户的创建。
  2. 请参见开通Dataphin与计算设置,完成Dataphin的购买。
  3. 请参见新建业务板块新建项目编辑项目,完成工作空间的创建及完成设置沙箱白名单。
    说明
    • 添加沙箱白名单时访问的网址填写:RDS ID.mysql.rds.aliyuncs.com,端口填写:3306
    • 新建项目时,选择Dev-Prod模式。项目的英文名称为:test_xianshang,中文名称为:线上。
    • 新建业务板块时,业务板块的英文名称为:xianshang,中文名称为:线上0423_0528_开发。
  4. 请参见管理数据域,完成数据域的创建,本教程以test_dataphin为例。
  5. 请参见创建同步目标表,完成同步任务时目标表dataphin_test的创建。使用到的SQL代码如下:
    CREATE TABLE IF NOT EXISTS `datax_test` (order_id bigint comment '订单号',`area` string comment '区域',province string comment '省份',city     string comment '城市',product_type string comment '类型',order_name string comment '客户名称',report_date datetime comment '日期',order_amt double comment '销售额')PARTITIONED BY (  `ds` STRING);
  6. 请参见添加Dataphin成员,完成工作空间成员的添加。添加两位成员并将角色分别设置为开发者项目管理员

准备数据源

本入门教程以统计某年办公用品、技术产品两类产品各省份每天的销售总额为例。

  1. 请参考创建RDS实例,完成本示例中RDS数据源的创建。本教程中RDS数据源名称以dataphin为例。
    说明
    • 地域选择华东2(上海)。
    • 网络类型选择专有网络。
    • 目前支持的数据源包括:MySQL、SQL Server、PostgreSQL、Oracle、DRDS、AnalyticDB。
  2. 下载本教程中使用的数据表格company_sales_recrod_copy
  3. 请参见将Excel的数据导入数据库,将数据表格company_sales_record_copy上传到新建的RDS数据源中。