本文为您汇总介绍实例异常排查的相关问题。

运维中心周期任务没有找到该任务

节点尚未发布到生产环境,请检查下是否发布失败。

有周期任务,但是周期实例一个都没有

【排查方式】请在右上角工作空间配置检查工作空间是否开启调度。如有需要请协调主账号开启工作空间调度。启用周期调度

有周期任务,有其他周期实例,但是这个任务没有产生周期实例

【排查方式】场景一:请检查任务是否在23:30之后发布。确认发布

【排查方式】场景二:右键周期任务DAG图 > 展开多层父节点,检查该节点是否没有挂在其他父节点下,成了孤立节点,收到孤立节点报警请第一时间处理。

【解决方法】节点依赖关系变动,导致节点没有上游依赖。请重新提交上下游设置节点依赖关系。

【排查方式】场景三:检查本节点及上游节点是否在有效期内。过期任务不产生周期实例。请在数据开发调度配置界面修改生效时间。调度生效周期

有周期任务,有周期实例但未运行

【排查方式】右键灰色实例DAG > 展开多层父节点,检查任务是否有正在运行、运行中、运行失败、等待状态,未冻结。父节点未执行成功,下游不会执行。

说明 更多任务未运行的排查与处理请参见任务未运行
【父节点状态】
  1. 实例状态:紫色(冻结)

    说明该实例被冻结了,任务将不会运行,并且阻塞下游,可以在实例详情,操作记录中查看相关记录。

  2. 实例状态:黄色(等待)

    等待任务定时时间,点开右下角查看实例详情,看任务定时时间。

    等待调度资源(日志中会显示),若出现此类等待说明当前项目下正在运行的任务达到上限,可以右键实例在运行诊断的调度资源部分查看任务等待资源时,哪些任务正在占用资源。

  3. 实例状态:灰色(待运行)

    请继续右键灰色实例,查看上游父节点,看其上游状态。

    如果都是灰色,请根据第二条检查是否没有挂在其他父节点下,孤立节点不运行。

说明 建议使用智能诊断和上游分析。
运行诊断
【现象原因】
  1. 正常调度,任务运行需要有多个条件,调度资源,定时时间,上游节点运行状态,正常调度(未被冻结)
  2. 上游没有出现以上任何一种状态,整个业务流程均为灰色,说明上游依赖关系变动导致业务流程都被孤立。

任务运行必须满足的条件有哪些?

  1. 任务定时时间已到(等待时间的节点状态:黄色)
  2. 该节点所有依赖的父节点都已经运行完成(运行成功节点状态:绿色,运维中心DAG图展开父节点)
  3. 项目下有足够的资源可运行任务(等待资源节点状态:黄色,日志中显示当前项目下任务并发达到上限,正在等待gateway资源)
  4. 任务正常调度(任务被冻结节点状态:紫色)