本章节为您介绍如何新建数据字典、质量校验函数和数据元。

前提条件

您已新建云计算资源,详细请参见:新建MaxCompute云计算资源

背景信息

设计字段标准为设计数据模型做准备。

新建数据字典并物理化

  1. 登录数据资源平台控制台
  2. 在页面左上角单击菜单图标,选择研发工作台 > 资产加工 > 数据标准图标,进入数据标准页面。
  3. 单击左侧导航栏字段标准设计 > 数据字典管理 > 进入按钮,进入数据字典管理页面。
  4. 数据字典管理页面,单击右上角+新建数据字典
  5. 弹出基础信息页面根据提示输入编码、参考数据集名称等信息,操作完成后单击下一步
  6. 弹出数据字典页面,单击+新增数据字典,并输入值编码、值名称,单击+新增数据字典可添加多个数据字典值,完成后单击确定
    新建数据字典配置如下:
    编码 参考数据集名称 值编码 值名称
    XZ_CODE_0001 婚姻状况 00 已婚
    01 未婚
    XZ_CODE_0002 性别 1
    2
    XZ_CODE_0003 教育水平 00 研究生
    01 本科
    02 高中
    03 职业高中
    04 职业学院
    XZ_CODE_0004 职业 00 保险
    01 教师
    02 外企白领
    03 自由职业
    04 IT工程师
  7. 数据字典管理列表查看新建的数据字典。数据字典管理
  8. 物理化数据字典:勾选新建的数据字典,单击物理化
    1. 弹出物理化数据字典预览页面,单击下一步物理数据字典预览
    2. 进入配置页面,选择云计算资源类型和云计算资源,单击下一步
    3. 进入执行页面,单击开始执行
    4. 等待数据字典物理化成功,单击确定
  9. 在页面左上角单击菜单图标,选择研发工作台 > 资产加工 > 数据探查 > 物理表探查,进入物理表探查页面。
    1. 选中MaxCompute下的云计算资源,输入字典表表名。
    2. 选中字典表表名,查看物理表数据预览。物理化值

新建质量校验函数并物理化

  1. 登录数据资源平台控制台
  2. 在页面左上角单击菜单图标,选择研发工作台 > 资产加工 > 数据标准图标,进入数据标准页面。
  3. 单击左侧导航栏字段标准设计 > 质量校验函数 > 进入按钮,进入质量校验函数管理页面。
  4. 质量校验函数页面,单击新建函数
  5. 弹出新建函数,在资源处单击添加资源,弹出新增资源页面,输入资源的各项信息,单击确定
    新建资源配置:
    资源名称 资源Code 资源类型 资源文件
    手机号码校验 sjhmjy MaxCompute Jar包:源代码请查看质量校验函数jar包源代码
    新建资源
  6. 新建函数页面根据提示输入函数名、Code、类名等信息,选择新建的资源,单击确定新建函数
    新建函数配置:
    函数名 函数Code 类名
    手机号码校验 sjhmjy com.aliyun.odps.udf.examples.PhoneNumberChecker
  7. 质量校验函数列表查看新建的函数。
  8. 物理化函数:选择函数类型为MaxCompute,勾选新建的函数,单击物理化
    1. 弹出物理化预览页面,单击下一步
    2. 进入配置页面,数据源选择,单击下一步
    3. 进入执行页面,单击开始执行
    4. 等待函数物理化成功,单击确定
  9. 在页面左上角单击菜单按钮,选择研发工作台 > 资产加工 > 数据建模,进入数据建模页面。
    1. 单击场景加工 > 公共节点 > 添加节点
    2. 弹出添加节点,输入节点名称、Code,单击下一步
    3. 在左侧页面函数列表下查看物理化成功的函数信息。函数查看

新建数据元并引用数据字典和质量校验函数

  1. 登录数据资源平台控制台
  2. 在页面左上角单击菜单图标,选择研发工作台 > 资产加工 > 数据标准图标,进入数据标准页面。
  3. 单击左侧导航栏字段标准设计 > 数据元管理 > 进入,进入数据元管理页面。
  4. 数据元管理页面,单击新建数据元
  5. 弹出新建-数据元页面,按提示输入数据元名称、所属类目、标识编码、数据元别名、数据元类型、长度、业务规则等信息。单击确定
    新建的数据元配置如下:
    数据元名称 code 类型 长度 引用数据字典 质量校验函数
    性别 xb 字符类 2 性别 /
    年龄 nl 整数类 5 / /
    婚姻状况 hyzk 字符类 2 婚姻状况 /
    手机号码 yddh1 字符类 16 / 手机号码校验
    教育水平 jysp 字符类 2 教育水平 /
    职业 career 字符类 2 职业 /
  6. 数据元管理页面查看新建的数据元。