任务配置

本章节介绍数据处理-任务配置相关功能。

平台可支撑自动驾驶生产线的全流程工作,包括数据导入数据标准化数据预处理数据预标注人工标注数据输出等。

您可拖拽所需任务节点,为其设置属性后,通过连线来快速构建所需工作流,并为其配置调度方式。

任务流配置说明

数据处理任务工作流的构建流程如下:

  1. 点击“添加任务”按钮添加工作流任务,并设置工作流的调度类型。

  • 任务流名字:自定义。

  • 调度类型:自动调度(定时)或手工调度(手动赋值变量)。

  1. 在系统节点列表中将所需节点拖拽至画布上,并设置节点属性。

  • 任务流中支持包含一个或多个节点,您可根据业务需求选择节点。

  • 各节点的详细配置说明,请参见下文“任务节点说明”。

  1. 将任务节点连线,形成工作流当任务流中包含多个任务节点时,连线上游节点的输出,将自动作为下游节点的输入数据集。

  2. 保存工作流并发布运行。

任务节点说明

下文为您说明各任务节点的配置,您可根据业务需求选择一个或多个节点构建所需任务流。

数据导入

数据导入节点的构建流程如下:

  1. 将系统节点列表中的“数据导入”节点拖拽至画布。

  2. 配置节点属性。其中,关键参数说明如下:

  • 任务名称:自定义。说明:该节点任务(或所在工作流)每执行一次,系统会使用“任务名称(该节点)-日期“生成一个数据集(可在“数据定义>数据集管理”模块查看)。

  • 数据源:需选择平台关联的OSS资源。

  • 导入路径:可填入OSS资源下的一个bucket,或一个目录(目录下仅包含数据,或包含多级子目录均可)。

数据标准化

数据标准化节点的构建流程如下:

  1. 将系统节点列表中的“数据标准化”节点拖拽至画布。

  2. 配置节点属性。其中,关键参数说明如下:

  • 数据标准化算子名称:选择所需算子;可选项为您自定义的或平台自带的数据标准化算子(可在“数据定义>自定义算子管理”模块下查看)。

  • 源数据类型/目标数据类型:选择算子后,系统会自动填入。说明:此处直接使用算子已配置的内容,不支持修改。如有修改需求,需在“数据定义>自定义算子管理”模块对算子进行修改。

  • 算法参数:算法运行时填写的参数。

数据预处理

数据预处理节点的构建流程如下:

  1. 将系统节点列表中的“数据预处理”节点拖拽至画布。

  2. 配置节点属性。其中,关键参数说明如下:

  • 数据预处理算子名称:选择所需算子;可选项为您自定义的或平台自带的数据预处理算子(可在“数据定义>自定义算子管理”模块下查看)。

  • 源数据类型/目标数据类型:选择算子后,系统会自动填入。说明:此处直接使用算子已配置的内容,不支持修改。如有修改需求,需在“数据定义>自定义算子管理”模块对算子进行修改。

  • 算法参数:算法运行时填写的参数。

数据预标注

数据预标注节点的构建流程如下:

  1. 将系统节点列表中的“数据预标注”节点拖拽至画布。

  2. 配置节点属性。其中,关键参数说明如下:

  • 数据预处理算子名称:选择所需算子;可选项为您自定义的或平台自带的数据预标注算子(可在“数据定义>自定义算子管理”模块下查看)。

  • 源数据类型/目标数据类型:选择算子后,系统会自动填入。说明:此处直接使用算子已配置的内容,不支持修改。如有修改需求,需在“数据定义>自定义算子管理”模块对算子进行修改。

  • 算法参数:算法运行时填写的参数。

人工标注任务

说明

人工标注任务用于将标准化、预处理、预标注后的数据输出到人工标注系统中进行数据标注。

人工标注任务节点的构建流程如下:

  1. 将系统节点列表中的“人工标注任务”节点拖拽至画布。

  2. 配置节点属性:选择标注系统,并设置相关信息。

  • 产品上目前支持直接向阿里云数字服务ADS打标系统发送人工标注任务并回流结果。

  • 如您需要关联其他打标系统,可联系阿里云团队进行适配。

数据处理及打标任务

说明

数据处理及打标任务用于跟踪人工标注系统的标注进度,并将人工标注系统结果拉回到平台进行后续处理。

数据处理及打标任务节点的构建流程如下:

  1. 将系统节点列表中的“数据处理及打标任务”节点拖拽至画布。

  2. 配置节点属性。其中,关键参数说明如下:

  • 处理方法:可选择“按时间段切割数据”或“按标签条件切割数据”。

  • 按时间段切割数据:选择后需设置时间轴对齐方式(绝对时间、相对时间)即通过指定绝对时间区间或相对时间区间,在选定数据集范围(名称匹配或上游输入)中,筛选满足条件的数据。

  • 按标签条件切割数据:选择后需设置标签条件表达式即通过各类已有的标签组合条件或其他条件的组合,在选定数据集范围(名称匹配或上游输入)中,筛选满足条件的数据。

  • 创建为新数据集:如勾选,则会将满足时间段条件/标签条件的数据,使用您指定的名称生成一个新数据集。

  • 打数据标签:选择“按标签条件切割数据”时,可勾选后可快速设置相应数据标签。

数据输出任务

说明

数据输出任务即将数据集打包输出至云计算对象存储中。

数据输出任务节点的构建流程如下:

  1. 将系统节点列表中的“数据输出任务”节点拖拽至画布。

  2. 配置节点属性。其中,关键参数说明如下:

  • 数据源:需选择平台关联的OSS资源。

  • 导出路径:可填入OSS资源下的一个bucket,或一个目录(目录下仅包含数据,或包含多级子目录均可)。