云原生多模数据库Lindorm计算引擎支持通过数据管理DMS的任务编排功能来调度Lindorm Spark任务,并查看Lindorm Spark任务发布记录和日志,满足用户在数据生产、交互式分析、机器学习和图计算等场景中的计算需求。本文介绍通过DMS管理Lindorm Spark作业的方法。
前提条件
- 已开通数据管理DMS服务。
- 已开通计算引擎。如何开通,请参见开通与变配。
- 已完成作业开发。如何开发,请参见JAR作业开发实践或Python作业开发实践。
- 已将作业上传至HDFS或OSS。如何上传至HDFS,请参见通过控制台上传文件。
创建Lindorm Spark任务流
- 登录数据管理DMS 5.0。
- 在顶部菜单栏中,选择集成与开发(DTS)。
- 在左侧导航栏,选择 。
- 在任务编排页面,单击新增任务流。
- 在新增任务流对话框中,输入任务流名称和描述,并单击确认。
- 在左侧任务类型列表中,拖拽Lindorm Spark任务节点到空白区域,并通过连线的方式定义任务节点之间的依赖关系。
- 配置Lindorm Spark任务节点。
- 发布任务流。所有的任务节点配置完成后,单击任务流名称页面左上方的发布。
查看任务流的发布记录和日志
- 在任务编排页面单击目标任务流名称。
- 单击任务流名称页面右上角的前往运维。
- 查看任务流的发布记录和日志。
- 查看任务流的发布记录。在任务流信息页面,单击发布列表页签可以查看任务流的发布记录。
- 查看任务流的日志。
- 在运行记录页签左上方的下拉列表中选择定时触发或者手动触发,可以查看任务流中所有任务节点的详细信息。
- 单击任务节点名称后面的查看,可以查看Lindorm Spark任务作业的提交日志,获取该任务节点的JobID和SparkUI。说明 如果任务提交失败,请将JobID和SparkUI提供给工单处理人员并提交工单。
- 在运行记录页签左上方的下拉列表中选择定时触发或者手动触发,可以查看任务流中所有任务节点的详细信息。
- 查看任务流的发布记录。在任务流信息页面,单击发布列表页签可以查看任务流的发布记录。
高级配置
说明 通过数据管理DMS控制台对Lindorm Spark任务流进行相关配置,配置完成后需要重新发布任务流。
调度配置
根据业务需求配置相应的调度策略,Lindorm Spark任务流会根据该调度策略自动执行。配置方法如下:
- 在任务编排页面单击目标任务流名称。
- 单击任务流名称页面左下角的任务流信息。
- 在右侧调度配置区域,打开开启调度开关,配置调度策略,配置项说明如下表。
配置项 说明 调度类型 选择调度类型: - 周期调度:周期性调度任务,例如一周执行一次任务。
- 调度一次:在指定时间执行一次任务,仅需要配置执行任务的具体时间。
生效时间 选择调度周期生效的区间,默认1970-01-01~9999-01-01,表示一直生效。 调度周期 选择调度任务的周期: - 小时:按设定的小时执行任务调度,需要配置定时调度。
- 日:按每日一次的频率执行任务调度,需要配置每日调度的具体时间。
- 周:以周为周期,每个指定天执行一次任务调度,需要配置指定时间和具体时间。
- 月:以月为周期,每个指定天执行一次任务调度,需要配置指定时间和具体时间。
定时调度 提供了2种定时调度的方式: - 固定间隔时间调度:
- 开始时间:执行任务的开始时间。
- 间隔时间:执行任务的间隔时间,单位为小时。
- 结束时间:执行任务的结束时间。
- 指定时间调度:选择执行任务的目标时间点。
例如选择和0小时和5小时,系统将在0点和5点执行任务。
指定时间 - 如果调度周期为周,选择星期几执行任务,支持多选。
- 如果调度周期为月,选择每月几号执行任务,支持多选。
具体时间 设置执行任务流的具体时间。 例如配置02:55,系统将在指定天的02时55分执行任务。
cron表达式 不需要手动配置,系统会根据您配置的周期、具体时间自动展现。 调度配置示例:如果需要配置任务流在每天0点和12点进行调度,调度策略配置如下。- 调度类型选择周期调度。
- 调度周期选择小时。
- 定时调度选择指定时间,同时在指定时间列表中选择0小时和12小时。
变量配置
对于周期调度的任务流,可以将调度时间作为参数传递给要执行的任务。例如:将业务时间bizdate
(运行时间的前一天)传递给任务节点,按照如下步骤配置时间变量。
- 在任务流名称页面,双击Lindorm Spark任务节点或者Lindorm Spark任务节点并选择
。
- 在右侧菜单栏选择变量设置。
- 在节点变量或者任务流变量页签中添加变量名。
- 在作业配置区域中使用变量。更多变量请参见变量概述。
通知配置
如果打开通知开关,系统会根据任务流执行的结果发送相应的通知消息。打开通知方法如下:
- 单击任务流名称页面左下角的通知配置。
- 根据业务需求打开对应的通知开关。
- 成功通知:任务流执行成功发送通知信息。
- 失败通知:任务流执行失败发送通知信息。
- 超时通知:任务流执行超时发送通知信息。
- 可选:配置消息接收人,请参见消息通知管理。
相关文档
有关数据管理DMS的任务编排功能,详情请参见任务编排概述。