JobSettings

名称类型描述示例值
object

作业额外参数配置。

BusinessUserIdstring

作业关联用户 ID。

166924
Callerstring

调用方。

SilkFlow
Tagsobject

自定义标签。

string

自定义标签。

PipelineIdstring

工作流 ID。

pid-123456
EnableTideResourceboolean

允许作业使用潮汐资源。

true
EnableErrorMonitoringInAIMasterboolean

允许打开作业容错监控。

false
ErrorMonitoringArgsstring

用户指定容错监控的配置参数,比如指定是否启动基于 log hang 的检测。

--enable-log-hang-detection true
EnableRDMAboolean

允许作业使用 RDMA。

true
EnableOssAppendboolean

运行 OSS 追加写。

true
OversoldTypestring

作业的超卖资源使用方式(不接受/可接受/只接受)。

AcceptQuotaOverSold
AdvancedSettingsobject

额外高级参数配置。

Driverstring

NVIDAI 驱动配置。

535.54.03
EnableSanityCheckboolean

允许作业开启算力健康检测。

true
SanityCheckArgsstring

算力健康检测的配置参数。

--sanity-check-timing=AfterJobFaultTolerant --sanity-check-timeout-ops=MarkJobFai
JobReservedMinutesinteger

作业结束后保留的时长,单位分钟。

30
JobReservedPolicystring

作业结束后保留的策略。

Always