名称 | 类型 | 描述 | 示例值 |
---|---|---|---|
object | 任务额外参数配置 | ||
BusinessUserId | string | 作业关联用户 ID | 16**** |
Caller | string | 调用方 | SilkFlow |
Tags | object | 自定义标签 | |
string | 标签 | ||
PipelineId | string | 工作流 ID | pid-123456 |
EnableTideResource | boolean | 允许任务使用潮汐资源 | true |
EnableErrorMonitoringInAIMaster | boolean | 允许打开作业容错监控 | false |
ErrorMonitoringArgs | string | 用户指定容错监控的配置参数,比如指定是否启动基于 log hang 的检测 | --enable-log-hang-detection true |
EnableRDMA | boolean | 允许作业使用 RDMA | true |
EnableOssAppend | boolean | 运行 OSS 追加写 | true |
OversoldType | string | 作业的超卖资源使用方式(不接受/可接受/只接受) | AcceptQuotaOverSold |
AdvancedSettings | object | 额外高级参数配置 | |
Driver | string | NVIDAI 驱动配置 | 535.54.03 |
EnableSanityCheck | boolean | 允许作业开启算力健康检测 | true |
SanityCheckArgs | string | 算力健康检测的配置参数 | --sanity-check-timing=AfterJobFaultTolerant --sanity-check-timeout-ops=MarkJobFai |
JobReservedMinutes | integer | 作业结束后保留的时长,单位分钟 | 30 |
JobReservedPolicy | string | 作业结束后保留的策略 | Always |
文档内容是否对您有帮助?