本文为您介绍如何创建业务流程、在业务流程中创建节点并配置依赖关系。完成创建后,您可以利用数据开发功能,对工作空间的数据进行深入分析和计算。

前提条件

开始本操作前,请确保您已根据建表并上传数据的操作,在工作空间中准备好业务数据表bank_data和其中的数据,以及结果表result_table

背景信息

DataWorks的数据开发功能支持在业务流程中,通过可视化拖拽来完成节点间的依赖设置。您可以通过操作业务流程的方式,实现对数据的处理和相互依赖。

新建业务流程

  1. 登录DataWorks控制台
  2. 在左侧导航栏,单击工作空间列表
  3. 选择工作空间所在地域后,单击相应工作空间后的进入数据开发
  4. 鼠标悬停至新建图标,单击业务流程
  5. 新建业务流程对话框中,输入业务名称描述
    注意 业务名称必须是大小写字母、中文、数字、下划线(_)以及小数点(.),且不能超过128个字符。
  6. 单击新建

新建节点并配置依赖关系

在业务流程中创建一个虚拟节点(start)和odps_sql节点(insert_data),并配置依赖关系为insert_data依赖于start
注意
  • 虚拟节点属于控制类型节点,在业务流程运行过程中,不会对数据产生任何影响,仅用于实现对下游节点的运维控制。
  • 虚拟节点在被其它节点依赖的情况下,如果被运维人员手动设置为运行失败,则下游未运行的节点将因此无法被触发运行。在运维过程中,可以防止上游的错误数据进一步扩展。
  • 业务流程中,虚拟节点的上游节点通常会被设置为工作空间根节点。工作空间根节点的格式为工作空间名_root

建议您在设计业务流程时,默认创建一个虚拟节点作为业务流程的根节点,来控制整个业务流程。设计业务流程的操作如下:

  1. 双击业务流程名称进入开发面板,鼠标单击虚拟节点并拖拽至右侧的开发面板。
    虚拟节点
  2. 新建节点对话框中,输入节点名称为start,单击提交
    注意 节点名称必须是大小写字母、中文、数字、下划线(_)以及小数点(.),且不能超过128个字符。
  3. 以同样的操作新建ODPS_SQL节点,命名为insert_data
  4. 通过拖拽连线,设置start节点为insert_data节点的上游节点。
    依赖关系

配置虚拟节点的上游依赖

在业务流程中,虚拟节点通常作为整个业务流程的控制器,是整个业务流程中所有节点的上游。通常设置业务流程中的虚拟节点依赖整个工作空间的根节点:

  1. 双击虚拟节点名称,单击右侧的调度配置
  2. 调度依赖区域,单击使用工作空间根节点,设置虚拟节点的上游节点为工作空间根节点。
    调度配置
  3. 单击工具栏中的保存图标。

在ODPS_SQL节点中编辑代码

本节将在ODPS_SQL节点insert_data中,通过SQL代码,查询不同学历的单身人士贷款买房的数量并保存结果,以便后续节点继续分析或展现。

SQL语句如下所示,具体语法说明请参见SQL概述
INSERT OVERWRITE TABLE result_table  --插入数据至result_table中。
SELECT education
    , COUNT(marital) AS num
FROM bank_data
WHERE housing = 'yes'
    AND marital = 'single'
GROUP BY education

运行并调试ODPS_SQL节点

  1. insert_data节点中编辑SQL语句后,单击保存图标,防止代码丢失。
  2. 单击运行图标。
    运行结束后,即可在页面下方查看运行日志和结果。

提交业务流程

  1. 运行并调试ODPS_SQL节点insert_data后,返回业务流程页面。
  2. 单击提交图标。
  3. 提交对话框中,选择需要提交的节点,输入备注,并选中忽略输入输出不一致的告警
  4. 单击提交

后续步骤

现在,您已经学习了如何创建和提交业务流程,您可以继续下一个教程。在该教程中,您将学习如何通过创建同步任务,将数据回流至不同类型的数据源中。详情请参见创建数据同步任务