本文以创建表bank_data和result_table为例,为您介绍如何通过DataWorks创建表并上传数据。

背景信息

表bank_data用于存储业务数据,表result_table用于存储数据分析后产生的结果。

创建表bank_data

  1. 进入数据开发页面。
    1. 登录DataWorks控制台
    2. 在左侧导航栏,单击工作空间列表
    3. 单击相应工作空间后的进入数据开发
  2. 鼠标悬停至新建图标,单击MaxCompute >
    您也可以打开相应的业务流程,右键单击MaxCompute,选择新建 >
  3. 新建表对话框,输入表名bank_data,单击提交
    注意
    • 表名不能超过64个字符,且必须以字母开头,不能包含中文或特殊字符。
    • 如果绑定多个实例,则需要选择MaxCompute引擎实例。
  4. 在表的编辑页面,单击DDL模式
  5. DDL模式对话框,输入如下建表语句,单击生成表结构
    CREATE TABLE IF NOT EXISTS bank_data
    (
     age             BIGINT COMMENT '年龄',
     job             STRING COMMENT '工作类型',
     marital         STRING COMMENT '婚否',
     education       STRING COMMENT '教育程度',
     default         STRING COMMENT '是否有信用卡',
     housing         STRING COMMENT '房贷',
     loan            STRING COMMENT '贷款',
     contact         STRING COMMENT '联系途径',
     month           STRING COMMENT '月份',
     day_of_week     STRING COMMENT '星期几',
     duration        STRING COMMENT '持续时间',
     campaign        BIGINT COMMENT '本次活动联系的次数',
     pdays           DOUBLE COMMENT '与上一次联系的时间间隔',
     previous        DOUBLE COMMENT '之前与客户联系的次数',
     poutcome        STRING COMMENT '之前市场活动的结果',
     emp_var_rate    DOUBLE COMMENT '就业变化速率',
     cons_price_idx  DOUBLE COMMENT '消费者物价指数',
     cons_conf_idx   DOUBLE COMMENT '消费者信心指数',
     euribor3m       DOUBLE COMMENT '欧元存款利率',
     nr_employed     DOUBLE COMMENT '职工人数',
     y               BIGINT COMMENT '是否有定期存款'
    );

    创建表的更多SQL语法请参见创建和查看表

  6. 确认操作对话框,单击确认
  7. 生成表结构后,在基本属性模块输入表的中文名,并分别单击提交到开发环境提交到生产环境
    说明 本示例以标准模式的工作空间为例。如果您使用的是简单模式的工作空间,仅单击提交到生产环境即可。
  8. 在左侧导航栏,单击表管理
  9. 表管理页面,双击打开相应的表名,查看表信息。

创建表result_table

  1. 数据开发页面,鼠标悬停至新建图标,单击MaxCompute >
    您也可以打开相应的业务流程,右键单击MaxCompute,选择新建 >
  2. 新建表对话框,输入表名result_table,单击提交
  3. DDL模式对话框,输入如下建表语句,单击生成表结构
    CREATE TABLE IF NOT EXISTS result_table
    (  
     education   STRING COMMENT '教育程度',
     num         BIGINT COMMENT '人数'
    );
  4. 确认操作对话框,单击确认
  5. 生成表结构后,在基本属性区域输入表的中文名,并分别单击提交到开发环境提交到生产环境
  6. 在左侧导航栏,单击表管理
  7. 表管理页面,双击打开相应的表名,查看表信息。

本地数据上传至bank_data

DataWorks支持以下操作:
  • 上传本地的文本文件至工作空间的表中。
  • 通过数据集成模块,从多个不同的数据源导入业务数据至工作空间。
说明 本地文本文件上传的限制如下:
  • 文件类型:仅支持.txt.csv.log类型的文件。
  • 文件大小:不超过30M。
  • 操作对象:支持分区表导入和非分区表导入,但不支持分区值为中文。

以导入本地文件banking.txt至DataWorks为例,操作如下:

  1. 数据开发页面,单击导入图标。
  2. 数据导入向导对话框,至少输入3个字母来搜索需要导入数据的表,单击下一步
  3. 选择数据导入方式上传本地数据,单击选择文件后的浏览...。选择本地数据文件,配置导入信息。
    参数 描述
    选择数据导入方式 默认上传本地文件
    选择文件 单击浏览...,选择本地需要上传的文件。
    选择分隔符 包括逗号Tab分号空格|#&等分隔符,此处选择逗号
    原始字符集 包括GBKUTF-8CP936ISO-8859,此处选择GBK
    导入起始行 选择导入的起始行,此处选择1
    首行为标题 设置首行是否为标题。
    数据预览 您可以在此处进行数据预览。
    说明 如果数据量过大,仅展示前100行和前50列的数据。
  4. 单击下一步
  5. 选择目标表字段与源字段的匹配方式,本示例选择按位置匹配
  6. 单击导入数据