您可在运维中心查看发布至生产环境的任务,并执行测试、补数据等相关运维操作。本文以周期调度任务的运维为例,通过确认调度任务的配置是否符合预期、使用补数据计算历史时间段的数据、配置任务的智能监控规则,保障任务后续可以正常调度,为您介绍运维中心模块的基本使用。
背景信息
- 对任务执行上下线,冻结等更多运维操作,详情请参见周期任务运维概述。
- 对任务运维操作进行相关管控,详情请参见运维操作管控(进阶)。
进入运维中心
- 登录DataWorks控制台。
- 在左侧导航栏,单击工作空间列表。
- 选择工作空间所在地域后,单击相应工作空间后操作列的
图标,选择运维中心。
操作流程
阶段一:测试验证调度任务
- 步骤一:查看周期任务配置
为避免周期任务调度不符合预期,建议您在任务发布后先检查周期任务配置的调度参数、调度资源组等是否正确。若不符合预期,请修改相应配置并重新发布。
- 步骤二:测试周期任务
通过冒烟测试功能验证周期任务在生产环境执行是否正确。若执行出错,请根据报错及时处理,保障任务可正常运行。
- 步骤三:周期任务补历史数据
通过补数据功能可重新计算历史时间段内的数据。
- 步骤四:查看周期实例
周期任务发布成功后会根据调度周期生成周期实例,如果在DataStudio中配置的实例生成方式为T+1次日生成,则任务将在第二天开始调度;如果配置为发布后即时生成,则任务当天便会调度。您可查看调度实例的生成及运行情况,判断任务的周期调度是否正常。
- 步骤五:查看执行结果
节点执行测试或补数据操作后,您可查看数据的写入情况。
阶段二:监控周期调度任务
- 步骤六:创建自定义监控规则
您可根据业务需求,为周期调度任务配置智能监控规则,监控任务的调度运行状况,保障该任务后续可以正常调度。
- 步骤七:创建智能基线(进阶)
通常,任务的执行会受多方因素影响,为保障任务可在指定时间顺利产出数据,您可为任务设置智能基线监控,当预测到任务无法在指定时间点完成时,基线会主动发送任务异常信息,帮助您及时获取并快速处理异常。
- 步骤八:创建资源组自动运维规则
通过自定义独享资源组的监控规则,对独享资源组的使用率及资源组上等待的实例数设置监控报警,并进行相关运维操作。
步骤一:查看周期任务配置
为避免周期任务调度不符合预期,建议您在任务发布后先查看该任务的配置(例如,任务的调度参数、节点依赖关系等)是否正确。
- 进入运维中心。
- 查找目标节点。
- 在左侧导航栏单击 。
- 在周期任务页面搜索目标节点。
- 查看节点详情。
- 单击目标节点,进入节点DAG图。
- 单击展开详情,查看节点的详细信息。
- 更多周期任务的操作,详情请参见查看并管理周期任务。
- 若节点的配置不符合预期,请进入数据开发(DataStudio)找到该节点,在节点编辑页面修改配置并重新发布。详情请参见节点相关操作。
result_table
节点,查看其调度参数、调度资源组配置是否正确。
步骤二:测试周期任务
通过对周期任务执行冒烟测试,验证该任务在生产环境的调度运行是否符合预期。该操作将真实执行代码逻辑。
result_table
节点的运行是否成功。您可根据图示步骤测试运行节点,并查看所生成测试实例的执行情况。
步骤三:周期任务补历史数据
周期任务开发完成并提交发布后,会按照调度配置定时运行。如果您希望重新计算历史时间段内的数据,则可通过补数据功能实现。
result_table
节点补业务日期20220801
~20220812
时间段每天00:00
~01:00
的数据。配置步骤参考下图。

步骤四:查看周期实例
周期任务发布成功后会根据调度周期生成周期实例,如果在DataStudio中配置的实例生成方式为T+1次日生成,则任务将在第二天开始调度;如果配置为发布后即时生成,则任务当天便会调度。您可查看生成的周期实例,判断任务的调度运行是否正常。
result_table
在2022.10.09
运行生成的周期实例情况。
步骤五:查看执行结果
- 进入数据地图查看。
- 使用
通过创建临时查询节点,使用SQL语句查看表数据。临时查询相关操作,详情请参见创建临时查询。
查看。
- RAM用户默认无MaxCompute引擎中生产表的查询权限。您可进入数据地图,在表的详情页申请该表权限。详情请参见申请表权限。
- 节点在数据开发执行时,数据将写入开发引擎项目;在生产环境执行时,数据将写入生产引擎项目。查询时,请确认数据所在引擎项目。您可进入工作空间管理页面,查看对应环境的引擎项目信息。
- MaxCompute支持跨项目访问表(例如,访问绑定的其他引擎项目中的表、开发项目访问生产项目中的表),但部分引擎不支持。对应引擎类型是否支持跨项目访问表,请以引擎的实际特性功能为准。
result_table
节点所在生产环境的引擎项目为xc_dpe_e2
,使用临时查询新建ODPS SQL节点,通过SQL语句查询生产环境中该表(即xc_dpe_e2.result_table)对应的分区数据。
步骤六:创建自定义监控规则
节点测试验证无误后,您可为节点自定义监控规则,监控节点运行状态。当节点运行出错时DataWorks会根据配置发送相应报警,以便您及时发现并处理异常,保障节点日后可正常调度。
- 进入运维中心。
- 在左侧导航栏单击 。
- 新建自定义规则。
步骤七:创建智能基线(进阶)
为保障任务可在指定时间内顺利产出,您可为任务设置基线监控。将任务添加至基线上并设置任务优先级和承诺时间,DataWorks将根据任务运行情况计算基线任务的预计完成时间,并使高优先级任务优先获得调度资源。当预测基线任务可能无法在承诺时间前完成时,DataWorks将发出报警,您可基于报警尽快处理异常。
- 进入运维中心。
- 在左侧导航栏单击 。
- 新建智能基线。
步骤八:创建资源组自动运维规则
如果您使用的是独享资源组运行任务,则可根据业务需求创建独享资源组的自动运维规则,对资源组的使用率及资源组上等待的实例数设置监控报警并进行相关运维操作。
- 当前仅支持基于独享调度资源组进行自动运维。
- 为避免资源紧张导致任务执行缓慢,您可将任务移至独享调度资源组上执行。修改任务使用的资源组,详情请参见修改任务使用的资源组。
- 进入运维中心。
- 创建资源组监控规则。
- 基于资源组监控规则配置自动运维规则。
运维操作管控(进阶)
运维中心支持节点冻结、节点解冻、补数据、节点下线等扩展点,您可使用该扩展点结合扩展程序,实现自定义管控任务的逻辑处理与运维操作。详情请参见扩展程序概述、应用示例:运维中心触发事件检查。