DataWorks的数据开发(DataStudio)模块提供了多种类型节点,同时,多种类型节点支持周期性任务调度,您可基于业务需要选择合适的节点进行相关开发操作。本文为您介绍DataWorks支持的节点合集。

数据开发支持的节点合集

数据开发(DataStudio)支持的节点类型汇总如下。
类型描述
数据集成同步类节点DataWorks数据集成支持复杂网络环境下的数据同步,并提供用于离线(批量)数据周期性同步的离线同步节点,与用于单表或整库增量数据实时同步的实时同步节点。该节点可在数据开发(DataStudio)界面直接创建。
引擎计算类节点DataWorks将计算引擎能力进行封装,您可基于引擎节点进行数据开发,无需接触复杂的引擎命令行,便可在DataWorks实现各类任务的周期性调度。

目前支持MaxComputeHologresE-MapReduceAnalyticDB For PostgreSQLAnalyticDB For MySQLMySQLClickHouseCDH算法等多类计算引擎的多种节点。

通用类节点DataWorks提供的通用类型节点可结合引擎计算节点进行复杂逻辑处理。例如:用于循环执行代码的do-while节点,与遍历、判断上游赋值结果的for-each节点、分支节点等。
扩展:自定义节点提供自定义节点插件化机制,支持您扩展计算任务类型,自主接入自定义计算服务。您可通过自定义节点开发,实现自定义处理代码逻辑。

数据集成同步类节点

用于数据同步任务使用,数据集成类型节点介绍如下。
数据集成节点使用介绍
离线同步节点用于离线(批量)数据周期性同步场景,并且支持复杂场景下多种异构数据源间数据同步。

离线同步支持的数据源详情,请参见支持的数据源与读写插件

实时同步节点用于增量数据实时同步场景。实时同步包括实时读取、转换和写入三种基础插件,各插件之间通过内部定义的中间数据格式进行交互。

实时同步支持的数据源详情,请参见实时同步支持的数据源

说明 除以上节点外,数据集成主站还支持多种类型同步方案。例如,全增量数据实时同步,整库离线同步等,详情请参见同步解决方案能力说明

引擎计算类节点

您可在具体业务流程,选择在某引擎下新建对应类型的引擎节点,基于该节点进行数据开发,并将引擎代码下发至对应的数据清洗引擎上执行。引擎计算类型节点介绍如下。
说明 请先为DataWorks工作空间开通对应的服务或绑定所需计算引擎,引擎绑定相关操作,详情请参见引擎绑定
DataWorks集成的引擎DataWorks对引擎能力的封装
MaxCompute
E-MapReduce
CDH
  • CDH HIVE
  • CDH SPARK
  • CDH MR
  • CDH Presto
  • CDH Impala
AnalyticDB For PostgreSQL创建AnalyticDB for PostgreSQL节点
AnalyticDB For MySQL创建AnalyticDB for MySQL节点
Hologres
ClickHouse创建ClickHouse SQL节点
算法(机器学习)
数据库及其他
说明 该类节点无需绑定引擎,但要新建相关数据源。

通用类节点

引擎节点可结合通用节点进行复杂逻辑处理。在具体业务流程下,您可在通用节点分组下新建所需节点,结合引擎节点实现复杂逻辑处理。不同节点的使用场景及相关介绍如下。
业务场景节点类型使用说明
业务管理虚拟节点虚拟节点属于控制类型节点,它是不产生任何数据的空跑节点,通常作为业务流程统筹节点的根节点,方便您管理节点及业务流程。
事件触发HTTP触发器节点如果您希望其他调度系统的任务完成后触发DataWorks上的任务运行,以使用此节点。
OSS对象检查节点通过监控OSS对象产生来触发下游节点执行。
FTP Check节点通过监控FTP文件产生来触发下游节点执行。
参数赋值与传递赋值节点用于参数传递,通过自带的output输出将赋值节点最后一条查询或输出结果通过节点上下文功能传递到下游,实现参数跨节点传递。
参数节点用于上游节点间参数汇总与分发向下传递。
控制类配置for-each节点用于遍历赋值节点传递的结果集。
配置do-while节点用于循环执行部分节点逻辑,同时您也可结合赋值节点来循环输出赋值节点传递的结果。
分支节点用于对上游结果进行判断,决定不同结果走不同的分支逻辑,您可结合赋值节点一起使用。
归并节点用于对上游节点的运行状态进行归并,解决分支节点下游节点的依赖挂载和运行触发问题。
其他Shell节点Shell节点支持标准Shell语法,但不支持交互性语法。
函数计算节点用于周期性调度处理事件函数,并完成与其它类型节点的集成和联合调度。

扩展:自定义节点

DataWorks提供自定义节点插件化机制,支持您扩展计算任务类型,自主接入自定义计算服务。您可本地开发好插件代码,通过节点配置界面将该插件添加至DataWorks中,添加完成后,可在具体业务流程的自定义分组中选择该自定义节点进行数据开发。自定义节点的使用流程如下。
操作流程步骤描述
step1:自定义插件包DataWorks自定义节点运行任务时,需调用自定义插件,因此在使用自定义节点前您需创建好自定义插件包,并上传发布至DataWorks,便于后续自定义节点运行任务使用。
step2:新增节点插件在DataWorks环境中部署该插件。
step3:新增自定义节点新增自定义节点,配置自定义节点与自定义插件关系,编辑自定义节点在DataWorks界面的交互方式,例如,基本信息、编辑器。