本章节为您介绍如何设计数据字典、质量校验函数和数据元。

前提条件

您已新建云计算资源,详细参见:添加MaxCompute云计算资源

背景信息

定义数据标准为数据模型设计做准备。

新建数据字典并物理化

  1. 登录数据资源平台控制台
  2. 在页面左上角单击菜单图标,选择研发工作台 > 资产加工 > 数据标准图标,进入数据标准页面。
  3. 单击左侧导航栏字段标准设计 > 数据字典管理 > 进入,进入数据字典管理页面。
  4. 数据字典管理页面,单击新建数据字典
  5. 弹出基础信息页面根据提示输入编码、名称等信息。操作完成后,单击下一步
  6. 弹出数据字典页面,单击新增数据字典,并配置值编码、值名称和值描述信息,单击新增数据字典可添加多个数据字典值,完成后单击确定
    要新建的数据字典如下:
    编码 参考数据集名称 值编码 值名称
    XZ_CODE_0001 婚姻状况 00 已婚
    01 未婚
    XZ_CODE_0002 性别 1
    2
    XZ_CODE_0003 教育水平 00 研究生
    01 本科
    02 高中
    03 职业高中
    04 职业学院
    XZ_CODE_0004 职业 00 保险
    01 教师
    02 外企白领
    03 自由职业
    04 IT工程师
  7. 数据字典管理列表查看新建的数据字典。
  8. 物理化数据字典。
    1. 勾选新建的数据字典,单击物理化
    2. 弹出物理化数据字典预览页面,单击下一步
    3. 进入配置页面,选择云计算资源类型和云计算资源,单击下一步
    4. 进入执行页面,单击开始执行
    5. 等待数据字典物理化成功,单击确定
  9. 在页面左上角单击菜单图标,选择研发工作台 > 资产加工 > 数据探查 > 物理表探查,进入物理表探查页面。
    1. 选中MaxCompute下的云计算资源,输入字典表表名。
    2. 选中字典表表名,查看物理表数据预览。物理化值

新建质量校验函数并物理化

  1. 登录数据资源平台控制台
  2. 在页面左上角单击菜单图标,选择研发工作台 > 资产加工 > 数据标准图标,进入数据标准页面。
  3. 单击左侧导航栏字段标准设计 > 质量校验函数 > 进入,进入质量校验函数管理页面。
  4. 质量校验函数页面,单击新建函数
  5. 弹出新建函数,在资源处单击添加资源,弹出新增资源页面,输入资源的各项信息,单击确定
    新建资源配置:
    资源名称 资源Code 资源类型 资源文件
    手机号码校验 sjhmjy MaxCompute Java包:源代码请查看质量校验函数jar包源代码
    新建资源
  6. 新建函数页面根据提示输入函数名、Code、类名等信息,选择新建的资源,单击确定新建函数
    新建函数配置:
    函数名 函数Code 类名
    手机号码校验 sjhmjy com.aliyun.odps.udf.examples.PhoneNumberChecker
  7. 质量校验函数列表查看新建的函数。
  8. 物理化函数。
    1. 选择函数类型,勾选新建的函数,单击物理化
    2. 弹出物理化预览页面,单击下一步
    3. 进入配置页面,数据源选择,单击下一步
    4. 进入执行页面,单击开始执行
    5. 等待函数物理化成功,单击确定
  9. 在页面左上角单击菜单按钮,选择研发工作台 > 资产加工 > 数据建模,进入数据建模页面。
    1. 单击场景加工 > 公共节点 > 添加节点
    2. 弹出添加节点,输入节点名称、Code,单击下一步
    3. 在页面函数列表下查看物理化成功的函数信息。函数查看

新建数据元并引用数据字典和质量校验函数

  1. 登录数据资源平台控制台
  2. 在页面左上角单击菜单图标,选择研发工作台 > 资产加工 > 数据标准图标,进入数据标准页面。
  3. 单击左侧导航栏字段标准设计 > 数据元管理 > 进入,进入数据元管理页面。
  4. 数据元管理页面,单击新建数据元
  5. 弹出新建-数据元页面,按提示输入数据元名称、所属类目、标识编码、数据元别名、数据元类型、长度、业务规则等信息。单击确定
    新建的数据元配置如下:
    数据元名称 code 类型 长度 引用数据字典 质量校验函数
    性别 xb 字符类 2 性别 /
    年龄 nl 整数类 5 / /
    婚姻状况 hyzk 字符类 2 婚姻状况 /
    手机号码 yddh1 字符类 16 / 手机号码校验
    教育水平 jysp 字符类 2 教育水平 /
    职业 career 字符类 2 职业 /
  6. 数据元管理页面查看新建的数据元。