iTAG不仅提供通用模板以满足各类常见的标注任务需求,还支持用户根据自身业务场景自定义标注模板。其中,自定义模板可以通过直接创建或导入的方式来生成。
背景信息
iTAG作为智能数据标注平台,提供了三种不同类型的模板以适应多样化的标注需求:
官方模板(推荐)
官方模板是由阿里云PAI官方提供的预置标准标注模板。这些模板通常覆盖了常见的标注场景,如图文解释、对话排序、视觉问答、视频OCR等。您可以直接选用官方模板开展标注工作,无需从零开始设计,简化了数据标注流程。
更多官方模板详情,请参见官方模板。
租户模板
租户模板是指在iTAG平台上由同一租户(即使用同一账号的企业或团队)创建并保存的个性化标注模板。这类模板是根据租户自身的业务场景定制的,可以复用或分享给该租户下的其他项目成员,以便快速启动相似类型的数据标注任务,提高标注效率和一致性。
自定义模板
自定义模板支持用户根据自身业务的独特需求创建全新的标注规范,您可以在iTAG平台上自由设计和配置标注模板。对于具有特殊标注要求的任务,自定义模板功能尤为重要,确保了高度灵活与精准的数据标注过程。
创建模板流程
本文以创建官方模板为例进行说明,租户模板和自定义模板操作同理。
进入智能标注(iTAG)。
登录PAI控制台。
在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间。
在左侧导航栏,选择数据准备>智能标注(iTAG)。
单击前往标注页面,然后在左侧导航栏选择管理中心>资产管理。
在模板管理页签下,单击新建模板,模板类型选择官方模板。
根据实际业务需求选择目标模板后,单击编辑,进入创建模板页面。
配置标注模板参数,各模板关键信息说明,请参见官方模板。
单击保存模板,完成配置。您也可以按需进行以下操作:
单击返回,即可返回到模板选择页面。
单击智能化配置,可配置预标注、UDF等服务。
单击废弃配置,可以设置是否允许废弃样本。
单击导入数据集,可以更改需要导入的数据集。
单击导出模板,可以导出并复制JSON格式的模板。
单击保存模板,可以保存当前配置完成的模板。
单击创建任务,可以保存当前配置完成的模板并创建相应任务。
后续操作
创建标注任务
您可以通过以下两种方式创建标注任务:
在创建模板页面,单击右下角的创建任务,输入模板名称后单击保存,在创建任务页面中配置任务参数,然后单击确认。
在管理中心>任务管理创建标注任务。相对于在创建模板页面中创建任务,在任务管理创建标注任务时,系统提供更加完善的参数选项,您可以最大限度地进行自定义配置,详情请参见创建标注任务。
处理标注任务
具体操作,请参见处理标注任务。
官方模板
iTAG模板市场提供了多个官方模板供您便捷地使用,主要包含大模型和机器学习两种类型。
下表为您展示部分常用官方模板,其他模板详情请以控制台页面信息为准。
模板名称 | 类型 | 标签 | 说明 |
机器学习(视频) | 视频帧框选、视频帧标记、全局题目 | 视频打点模板可以对视频内容进行检测,包括模板提供视频帧框选(框选打标)、视频帧标注(针对区间标注)、全局题目(对视频内容进行题目打标)三个组件功能。 | |
机器学习(视频) | 视频OCR | 视频OCR模板可以在视频中框选出含文字部分时,自动对框内文字进行识别。 | |
机器学习(图像) | 图像语义分割 | 图像语义分割模板可以将图片内容进行分割,并配置题目对分割内容进行打标。 | |
大模型(多模态) | 图生文 | 图生文模板支持SAM及自研分割算法快速分割图形,结合LLM文本生成能力,探索智能化标注在AIGC场景下的应用。 | |
大模型(多模态) | 图文解释 | 图文解释模板用于关联图片选区与文本实体。 | |
大模型(大语言模型) | 对话改写 | 对话改写模板可以在给定的主题下对该主题进行提问。您可以选择最合适的机器人回答,并对其进行改写。 | |
大模型(多模态) | 多模态RLHF标注 | 多模态RLHF标注模板提供多模态RLHF标注的功能,在对话改写的基础上,可以接入输入机器人进行自动问答,也可以在手动问答模式输入图片等多模态类型内容。 | |
大模型(多模态) | |||
大模型(大语言模型) | 对话排序 | 对话排序模板可以将对话内容进行分类排序。 | |
大模型(多模态) | VQA对话 | 视觉问答模板可以根据您提供的图片,对图片的内容进行问答,问答均可接入机器人UDF。其中,单轮对话指问题和答案不考虑上下文内容;多轮对话指问题和答案会结合上下文产出。 | |
大模型(多模态) | |||
大模型(大语言模型) | 对话分组 | 对话分组模板可以将一系列的对话分为不同的组别,同时支持改写对话。 | |
大模型(大语言模型) | 智能评分 | 智能评分模板可以对问答内容进行改写,同时支持针对每道标注的内容配置不同的题目。 |