JobSettings

名称类型描述示例值
object

任务额外参数配置

BusinessUserIdstring

作业关联用户 ID

16****
Callerstring

调用方

SilkFlow
Tagsobject

自定义标签

string

标签

PipelineIdstring

工作流 ID

pid-123456
EnableTideResourceboolean

允许任务使用潮汐资源

true
EnableErrorMonitoringInAIMasterboolean

允许打开作业容错监控

false
ErrorMonitoringArgsstring

用户指定容错监控的配置参数,比如指定是否启动基于 log hang 的检测

--enable-log-hang-detection true
EnableRDMAboolean

允许作业使用 RDMA

true
EnableOssAppendboolean

运行 OSS 追加写

true
OversoldTypestring

作业的超卖资源使用方式(不接受/可接受/只接受)

AcceptQuotaOverSold
AdvancedSettingsobject

额外高级参数配置

Driverstring

NVIDAI 驱动配置

535.54.03
EnableSanityCheckboolean

允许作业开启算力健康检测

true
SanityCheckArgsstring

算力健康检测的配置参数

--sanity-check-timing=AfterJobFaultTolerant --sanity-check-timeout-ops=MarkJobFai
JobReservedMinutesinteger

作业结束后保留的时长,单位分钟

30
JobReservedPolicystring

作业结束后保留的策略

Always