功能介绍

更新时间: 2024-12-13 14:44:55

数据管理DMS的任务编排主要用于编排各类任务节点并进行周期或事件调度执行。您可以通过创建一个或多个任务节点组成的任务流,实现复杂的任务调度,提高数据开发效率。

背景信息

随着互联网和物联网的飞速发展、数据规模急剧增长、数据来源多样化,同时数据分析需求及业务流程复杂性不断增加,这使得传统手动处理数据的方式无法满足现有需求。因此,需要一个自动化流程来确保数据处理、分析、备份等多种需求的顺序和正确性。

针对以上问题,DMS的任务编排应运而生,其可自动化处理数据,提高数据开发效率,减少出错率,提升数据价值和可靠性。

支持的数据库类型

  • 关系型数据库:

    • MySQL:RDS MySQLPolarDB MySQL版MyBase MySQLPolarDB分布式版、其他来源MySQL

    • SQL Server:RDS SQL ServerMyBase SQL Server、其他来源SQL Server

    • PostgreSQL:RDS PostgreSQLPolarDB PostgreSQL版MyBase PostgreSQL、其他来源PostgreSQL

    • OceanBase:OceanBase MySQL模式OceanBase Oracle模式、自建OceanBase

    • PolarDB PostgreSQL版(兼容Oracle)

    • Oracle

    • 达梦数据库

    • DB2

  • NoSQL:Lindorm

  • 数据仓库:

    • AnalyticDB for MySQL

    • AnalyticDB for PostgreSQL

    • DLA

    • MaxCompute

    • Hologres

  • 对象存储:OSS

任务类型介绍

分类

任务类型

描述

相关文档

数据集成

DTS数据迁移

实现跨库、全量、单表或整库的数据迁移,迁移的类型包括数据和结构。

配置DTS数据迁移节点

离线数据集成

用于数据迁移、数据传输等场景,实现数据源之间的数据同步。

配置离线数据集成节点

数据加工

单实例SQL

将SQL语句发放到指定的关系型数据库上并执行。

说明

如果目标实例已开启无锁结构变更,单实例SQL任务会优先采用无锁结构变更的方式执行,可以有效避免锁表问题。更多信息,请参见开启无锁结构变更

循环SQL

可循环生成SQL语句,再将其分批提交给DMS管理的任意关系型数据库执行,同时,还可以搭配变量,控制SQL循环次数,达到简化SQL循环逻辑、平衡SQL语句对源库产生压力的目的。

配置循环SQL节点

跨库Spark SQL

基于Spark引擎,实现大规模跨库数据传输和数据加工,主要针对各类跨库数据同步和数据加工场景。

配置跨库Spark SQL节点

Lindorm Spark

通过Lindorm计算引擎高效地完成分布式计算任务,满足用户在数据生产、交互式分析、机器学习和图计算等场景中的计算需求。

配置Lindorm Spark节点

ADB Spark

支持周期性、有顺序地调度Spark作业。

配置AnalyticDB MySQL Spark节点

DLA Serverless Spark

用于配置Serverless Spark作业。

创建和执行Spark作业

无锁数据变更

采用DMS无锁技术实现数据的Update、Delete等变更。

说明

目标实例需开启无锁结构变更。更多信息,请参见开启无锁结构变更

DML无锁变更概览

DLA Spark SQL

通过SQL的方式提交作业到DLA Spark集群。

通用

单实例SQL赋值

将SELECT语句读取的数据赋值给输出变量,输出变量可以在下一节点中被使用。

配置SQL赋值节点

条件分支

条件分支节点可用于在任务流中进行条件判断。执行任务流时,如果条件分支节点的条件表达式判断结果为True,执行后续任务,否则不执行后续任务。

配置条件分支节点

DLA一键数仓

基于DLA一键建仓的功能,将数据库的数据上传到OSS,建立数据仓库。

一键建仓

DBS备份

通过DBS将数据库的数据备份到DBS提供的OSS中。

DBS

EC远程命令

基于ECS云助手在远程ECS上执行Shell、PowerShell、Bat命令或脚本代码。

配置ECS远程命令节点

脚本代码

基于数据库网关的脚本任务可以实现周期性或定时运行脚本。

配置脚本代码节点

仪表盘推送

仪表盘推送节点通过联动数据服务功能,可以将数据可视化的图表直接推送至您的钉钉、钉钉机器人或邮箱中。

配置仪表盘推送节点

状态检查

表时间列状态检查

检查某一时间点后,目标表中是否有新增数据。

Lindorm文件检查

用于检查Lindorm HDFS下某个文件是否存在。

SQL状态检查

通过SQL语句检查数据状态。例如,统计班级里男生是否超过10人。

稽核任务

用于检查数据质量。设置质量规则和调度周期后,自动检查数据质量并生成报告。

任务流依赖检查

实现任务流自依赖和跨任务流间依赖,依赖的目标对象可以是某个任务流或某个任务节点。

配置任务流依赖检查节点

相关文档

上一篇: 任务编排 下一篇: 使用场景
阿里云首页 数据管理 相关技术圈