对于已注册的数据集,推荐您使用智能标注(iTAG)提供的通用模板进行任务标注。如果通用模板无法满足您的需求,智能标注(iTAG)也支持您根据自己特定的场景,通过拼接内容组件和题目组件自定义模板。本文主要介绍如何通过智能标注(iTAG)预置的通用模板创建标注任务。

前提条件

已将原始数据上传至OSS并注册为数据集,详情请参见准备待标注的数据文件

使用限制

仅智能标注(iTAG)的管理员可以创建标注任务。

操作步骤

  1. 进入智能标注(iTAG)。
    1. 登录PAI控制台
    2. 在左侧导航栏,选择数据准备 > 智能标注(iTAG)
  2. 智能标注(iTAG)页面的任务中心页签,单击创建任务
  3. 创建标注任务页面的选择数据与模板配置向导页面,配置如下参数,并单击下一步
    创建标注任务-选择数据与模板
    参数 描述
    输入数据集 选择在PAI数据集管理中已经注册的数据集。
    模板类型 支持以下类型的模型:
    • 通用模板:平台预置的常用模板。
    • 自定义模板:根据自己特定的场景,参考页面提示拼接内容组件题目组件,从而通过自定义模板创建标注任务。
    模板 模板类型通用模板时,选择标注任务的模板。系统支持以下模板:
    • 文本类
      • 实体识别:建立文本实体之间的关系。
      • 文本分类:对文本按照预设标签进行分类标记,支持单标签和多标签分类。
      • 实体关系:文本实体之间的关系,用于知识图谱场景。
    • 图像类
      • 图片OCR:对图片框选区域内的文字进行OCR。
      • 目标检测:对图像中的具体目标进行定位。
      • 图像分类:按照预设的标签分类标记图像。
    • 视频类

      视频分类:对视频按照预设标签进行分类标记,支持单标签和多标签分类。

    • 音频类
      • 音频分类:对音频按照预设标签进行分类标记,支持单标签和多标签分类。
      • 音频分割:对音频数据集的内容进行分割并分段添加标签。
      • 音频识别:将音频内容的文字进行识别。
    标签配置 针对每种预置模板,根据页面提示配置标注任务所需要的标签,且系统支持标签为单选多选模式。
  4. 创建标注任务页面的调整预览配置向导页面,预览标注任务,并单击下一步
  5. 创建标注任务页面的分发任务配置向导页面,配置如下参数,并单击创建
    参数 描述
    任务名称 长度为1~100个字符,以小写字母、大写字母、数字或中文开头,可以包含下划线(_)或短划线(-)。
    任务说明 标注任务的简要说明,以区分不同的任务。
    子任务包分配 选择任务分发方式,支持以下分配方式:
    • 固定大小:每次标注员领取固定数量的标注任务。
    • 按导入字段:按照数据集的字段分配标注任务。
    任务流程 任务标注包括打标、检查及验收环节,每个环节的详细信息如下:
    • 打标:标注员在标注任务页面,先领取标注任务包,再完成标注,最后提交相应的标注任务。
    • 检查:标注环节完成后,标注员在质检任务页面,领取已经标注完成的任务包后,对其进行检查、修改或驳回。
    • 验收:需求方将标注完成或质检完成的任务进行最后一步的验收。需求方在验收任务页面,领取相应任务包后,对其进行验收、修改或驳回。
    智能标注(iTAG)支持一个或多个环节组成的多种标注模式(打标打标-检查打标-验收打标-检查-验收),您可以结合实际情况进行选择。
    检查比例 如果您选择的任务流程包括检查环节,例如打标-检查打标-检查-验收,则需要配置在检查过程中,对标注任务抽查的比例,默认为100%。
    人员配置 根据选择的任务流程,配置标注人员、检查人员、验收人员或任务管理员,您可以与该AI工作空间下的多个成员,协作完成标注任务。智能标注(iTAG)中的角色权限请参见人员管理及权限

后续步骤

您可以领取标注任务并进行图像标注,详情请参见标注图像(打标、质检及验收)