iTAG是PAI的数据标注平台,提供多种标注模板,支持图像、文本、视频、音频等数据类型的标注以及多模态标注。
支持的标注任务
iTAG预置了标注模板,可支持以下类型的标注任务:
图像类:图像分类、目标检测、图像OCR、表格识别、图像语义分割。
文本类:文本分类、命名实体识别、实体关系识别。
音频类:音频分类、音频分割、音频识别。
除控制台中直接提供的文本分类、图像分类等标注模板外,其他标注模板使用方法请参见模板管理。
使用流程
将待标注数据上传至对象存储OSS,然后通过数据集管理模块,从OSS路径导入数据以创建数据集。系统将为数据生成一个
.manifest格式的索引文件(一种包含数据路径和元信息的JSONL文件),用于后续的标注任务。重要目前iTAG仅支持数据存储在OSS,为确保正常访问,OSS Bucket 所在地域需与 PAI 保持一致。
对于已创建的数据集,通过iTAG提供的通用模板或自定义模板创建标注任务并分发。任务分发流程分为标注、检查及验收三个环节,其中标注为必选环节,检查和验收为可选环节。各环节的主要作用如下:
标注:标注员在标注任务页面,领取标注任务包,完成标注并提交。
检查:标注员在检查任务页面,领取已经标注完成的任务包,进行检查、修改或驳回。
验收:需求方在验收任务页面,领取相应任务包后,对其进行最后阶段的验收、修改或驳回。
按照任务流程为任务包进行标注、检查或验收,从而获得标注好的数据。
将标注结果导出至指定的OSS目录,用于模型训练。支持导出
.csv、.jsonl、.manifest和.coco格式的标注结果数据。
计费说明
获取帮助
查阅iTAG常见问题:如果您遇到数据加载出错、缺少操作权限、配置OSS跨域访问规则(CORS)等产品使用问题,请查阅iTAG常见问题。
询问阿里云官网AI助理:官网右下角的AI助理能实时、精准地解答您使用云产品时遇到的问题,快速为您提供技术支持、解决方案和文档指引。
