PAI分布式训练开启基于AIMaster的容错监控

PAI分布式训练(DLC)开启基于AIMaster的容错监控,视为“合规”。无训练任务时视为“不适用”。

风险等级

默认风险等级:高风险。

当您使用该规则时,可以按照实际需求变更风险等级。

检测逻辑

  • PAI分布式训练(DLC)开启基于AIMaster的容错监控,视为“合规”。

  • 无训练任务时视为“不适用”。

规则详情

参数

说明

规则名称

PAI分布式训练开启基于AIMaster的容错监控

规则标识

pai-dlc-error-monitoring-ai-master-enabled

标签

[PAIWorkspace]

自动修正

不支持

规则触发机制

周期24小时

规则支持的资源类型

[ACS::PAIWorkspace::Workspace]

规则入参

修正指导

具体修复操作,请参见AIMaster:弹性自动容错引擎