智能标注(iTAG)

更新时间: 2024-12-03 11:01:23

iTAG是PAI产品的智能化数据标注平台,支持图像、文本、视频、音频等多种数据类型的标注以及多模态的混合标注。iTAG提供了丰富的标注内容组件和题目组件,您可以直接使用平台预置的标注模板,也可以根据实际业务场景自定义模板进行数据标注。

任务流程

iTAG中,完整的数据标注流程包括以下步骤:

  1. 创建数据集

    通过数据集管理模块将待标注的原始数据创建为数据集,从而生成.manifest索引文件。

  2. 创建标注任务

    对于已创建的数据集,通过iTAG提供的通用模板或自定义模板创建标注任务并分发任务。任务分发流程分为打标、质检及验收三个环节,其中打标为必选环节,质检和验收为可选环节。因此创建标注任务时,您可以选择以下四种流程:标注标注-检查标注-验收标注-检查-验收。任务分发各环节的主要任务如下:

    • 标注:标注员在标注任务页面,先领取标注任务包,再完成标注,最后提交相应的标注任务。

    • 检查:标注环节完成后,标注员在质检任务页面,领取已经标注完成的任务包后,对其进行检查、修改或驳回。

    • 验收:需求方将标注完成或质检完成的任务进行最后一步的验收。需求方在验收任务页面,领取相应任务包后,对其进行验收、修改或驳回。

  3. 处理标注任务

    按照任务流程为任务包进行打标、质检或验收,从而获得标注好的数据。

  4. 导出标注结果数据

    将标注结果导出至指定的OSS目录,从而将其用于模型训练。

数据格式

  • 智能标注的输入数据格式

    在创建标注任务过程中需要选择已创建的数据集,该数据集需要满足.manifest格式。您可通过PAI数据集管理模块创建数据集,系统会为该数据集自动生成标注所需要的.manifest数据格式。具体的数据格式请参见创建数据集

  • 导出的标注结果的数据格式

    iTAG支持导出.csv.jsonl.manifest.coco格式的标注结果数据,标注流程中,标注、质检、验收环节的数据格式请参见导出标注结果数据

联系我们

如果您在使用iTAG时遇到问题,或有标注外包服务的相关需求,请使用钉钉搜索群号21930006619,进群咨询。

上一篇: Model Gallery常见问题 下一篇: 云产品依赖与授权:iTAG
阿里云首页 人工智能平台 PAI 相关技术圈