名称 | 类型 | 描述 | 示例值 |
---|---|---|---|
object | 作业额外参数配置。 | ||
BusinessUserId | string | 作业关联用户 ID。 | 166924 |
Caller | string | 调用方。 | SilkFlow |
Tags | object | 自定义标签。 | |
string | 自定义标签。 | ||
PipelineId | string | 工作流 ID。 | pid-123456 |
EnableTideResource | boolean | 允许作业使用潮汐资源。 | true |
EnableErrorMonitoringInAIMaster | boolean | 允许打开作业容错监控。 | false |
ErrorMonitoringArgs | string | 用户指定容错监控的配置参数,比如指定是否启动基于 log hang 的检测。 | --enable-log-hang-detection true |
EnableRDMA | boolean | 允许作业使用 RDMA。 | true |
EnableOssAppend | boolean | 运行 OSS 追加写。 | true |
OversoldType | string | 作业的超卖资源使用方式(不接受/可接受/只接受)。 | AcceptQuotaOverSold |
AdvancedSettings | object | 额外高级参数配置。 | |
Driver | string | NVIDAI 驱动配置。 | 535.54.03 |
EnableSanityCheck | boolean | 允许作业开启算力健康检测。 | true |
SanityCheckArgs | string | 算力健康检测的配置参数。 | --sanity-check-timing=AfterJobFaultTolerant --sanity-check-timeout-ops=MarkJobFai |
JobReservedMinutes | integer | 作业结束后保留的时长,单位分钟。 | 30 |
JobReservedPolicy | string | 作业结束后保留的策略。 | Always |
文档内容是否对您有帮助?