名称 | 类型 | 描述 | 示例值 |
---|---|---|---|
object | 算法定义。 | ||
OutputChannels | array | 算法输出通道列表。 | |
OutputChannels | Channel | 算法输出通道。 | |
HyperParameters | array | 超参数定义列表。 | |
HyperParameters | HyperParameterDefinition | 超参数定义。 | |
JobType | string | 任务类型。 | TFJob |
Command | array | 训练任务运行命令列表。 | |
Command | string | 训练任务运行命令。 | python train.py |
MetricDefinitions | array | 训练任务指标采集定义列表。 | |
MetricDefinitions | MetricDefinition | 训练任务指标采集定义。 | |
InputChannels | array | 算法输入通道列表。 | |
InputChannels | Channel | 算法输入通道。 | |
SupportsDistributedTraining | boolean | 是否支持分布式训练。 | true |
Image | string | 训练镜像。 | registry.cn-shanghai.aliyuncs.com/pai-training/kmeans:v1.0.0 |
SupportedInstanceTypes | array | 训练支持的弹性计算实例列表。 | |
string | 训练支持的弹性计算实例。 | ecs.g6.2xlarge | |
ComputeResource | object | 计算资源定义。 | |
Policy | object | 算法的计算资源配置策略。 | |
Version | string | 配置策略版本。 | V1 |
Value | string | 策略内容,由 json 数组序列化而成。 | [{\"MinTotalCount\":1,\"MaxTotalCount\":4,\"RolePolicies\":{\"chief\":{\"Count\":1},\"ps\":{\"Count\":1},\"worker\":{\"Percentage\":100}}},{\"MinTotalCount\":5,\"MaxTotalCount\":10,\"RolePolicies\":{\"chief\":{\"Count\":1},\"ps\":{\"Percentage\":20},\"worker\":{\"Percentage\":80}}},{\"MinTotalCount\":11,\"RolePolicies\":{\"chief\":{\"Count\":1},\"ps\":{\"Percentage\":40},\"worker\":{\"Percentage\":60}}}] |
CodeDir | Location | 自定义代码配置。 | |
Customization | object | 自定义配置。 | |
CodeDir | boolean | 是否使用自定义挂载的代码。 | true |
ResourceRequirements | array | 资源需求。 | |
ConditionExpression | 资源需求表达式。 | ||
ProgressDefinitions | object | 训练进度监控。 | |
OverallProgress | object | 训练进度监控。 | |
Description | string | 监控描述。 | training progress |
Regex | string | 监控正则表达式。 | ^[0-9]+([.][0-9]+){0,1}$ |
RemainingTime | object | 训练剩余时间监控。 | |
Description | string | 监控描述。 | training remaining time |
Regex | string | 监控正则表达式。 | ^[0-9]+([.][0-9]+){0,1}$ |
文档内容是否对您有帮助?