iTAG是PAI提供的智能化数据标注平台,支持图像、文本、视频、音频等多种数据类型的标注以及多模态的混合标注。iTAG提供了丰富的标注内容组件和题目组件,您可以直接使用平台预置的标注模板,也可以根据实际业务场景自定义模板进行数据标注。
使用流程
在iTAG中,完整的数据标注流程包括以下步骤:
准备数据:标注数据必须存储在阿里云对象存储OSS(Object Storage Service)中。为确保正常访问,OSS Bucket所在地域需与PAI工作空间地域保持一致。
若在标注时遇到图片或视频无法显示的问题,通常需要为OSS配置跨域访问规则(CORS)。
通过数据集管理模块,从OSS路径导入原始数据以创建数据集。系统将为您的数据生成一个
.manifest
格式的索引文件,用于后续的标注任务。对于已创建的数据集,通过iTAG提供的通用模板或自定义模板创建标注任务并分发。任务分发流程分为打标、质检及验收三个环节,其中打标为必选环节,质检和验收为可选环节。您可以选择以下四种流程:标注、标注-检查、标注-验收、标注-检查-验收。任务分发各环节的主要任务如下:
标注:标注员在标注任务页面,领取标注任务包,完成标注并提交。
检查:标注员在质检任务页面,领取已经标注完成的任务包,进行检查、修改或驳回。
验收:需求方在验收任务页面,领取相应任务包后,对其进行验收、修改或驳回,进行最后一步验收。
按照任务流程为任务包进行打标、质检或验收,从而获得标注好的数据。
将标注结果导出至指定的OSS目录,用于模型训练。支持导出
.csv
、.jsonl
、.manifest
和.coco
格式的标注结果数据。
计费说明
ITAG平台:如果您使用iTAG平台并由您自己的团队进行纯人工标注,iTAG平台本身不收取任何费用。
对象存储OSS:iTAG的运行依赖于阿里云对象存储OSS。因此,使用过程中产生的OSS存储和数据读写流量等费用,将按照OSS计费标准单独收取。
智能标注服务:平台针对部分模板(如图生文、图文描述等)提供的智能标注服务目前免费。 未来若有收费计划,将会另行通知。
人工标注外包服务:如果您需要委托阿里云的专业团队进行数据标注,可以提交工单联系PAI团队获取该项付费服务。
联系我们
如果您在使用iTAG时遇到问题,或有标注外包服务的相关需求,请使用钉钉搜索群号21930006619,进群咨询。