模板概述

iTAG不仅提供通用模板以满足各类常见的标注任务需求,还支持用户根据自身业务场景自定义标注模板。其中,自定义模板可以通过直接创建或导入的方式来生成。

背景信息

iTAG作为智能数据标注平台,提供了三种不同类型的模板以适应多样化的标注需求:

  • 官方模板(推荐)

    官方模板是由阿里云PAI官方提供的预置标准标注模板。这些模板通常覆盖了常见的标注场景,如图文解释、对话排序、视觉问答、视频OCR等。您可以直接选用官方模板开展标注工作,无需从零开始设计,简化了数据标注流程。

    更多官方模板详情,请参见官方模板

  • 租户模板

    租户模板是指在iTAG平台上由同一租户(即使用同一账号的企业或团队)创建并保存的个性化标注模板。这类模板是根据租户自身的业务场景定制的,可以复用或分享给该租户下的其他项目成员,以便快速启动相似类型的数据标注任务,提高标注效率和一致性。

  • 自定义模板

    自定义模板支持用户根据自身业务的独特需求创建全新的标注规范,您可以在iTAG平台上自由设计和配置标注模板。对于具有特殊标注要求的任务,自定义模板功能尤为重要,确保了高度灵活与精准的数据标注过程。

创建模板流程

本文以创建官方模板为例进行说明,租户模板和自定义模板操作同理。

  1. 进入智能标注(iTAG)。

    1. 登录PAI控制台

    2. 在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间。

    3. 在左侧导航栏,选择数据准备>智能标注(iTAG)

  2. 单击前往标注页面,然后在左侧导航栏选择管理中心>资产管理

    image

  3. 模板管理页签下,单击新建模板模板类型选择官方模板

  4. 根据实际业务需求选择目标模板后,单击编辑,进入创建模板页面。

  5. 配置标注模板参数,各模板关键信息说明,请参见官方模板

  6. 单击保存模板,完成配置。您也可以按需进行以下操作:

    • 单击返回,即可返回到模板选择页面。

    • 单击智能化配置,可配置预标注、UDF等服务。

    • 单击废弃配置,可以设置是否允许废弃样本。

    • 单击导入数据集,可以更改需要导入的数据集。

    • 单击导出模板,可以导出并复制JSON格式的模板。

    • 单击保存模板,可以保存当前配置完成的模板。

    • 单击创建任务,可以保存当前配置完成的模板并创建相应任务。

后续操作

创建标注任务

您可以通过以下两种方式创建标注任务:

  • 创建模板页面,单击右下角的创建任务,输入模板名称后单击保存,在创建任务页面中配置任务参数,然后单击确认

  • 管理中心>任务管理创建标注任务。相对于在创建模板页面中创建任务,在任务管理创建标注任务时,系统提供更加完善的参数选项,您可以最大限度地进行自定义配置,详情请参见创建标注任务

处理标注任务

具体操作,请参见处理标注任务

官方模板

iTAG模板市场提供了多个官方模板供您便捷地使用,主要包含大模型和机器学习两种类型。

下表为您展示部分常用官方模板,其他模板详情请以控制台页面信息为准。

模板名称

类型

标签

说明

视频打点

机器学习(视频)

视频帧框选、视频帧标记、全局题目

视频打点模板可以对视频内容进行检测,包括模板提供视频帧框选(框选打标)、视频帧标注(针对区间标注)、全局题目(对视频内容进行题目打标)三个组件功能。

视频OCR

机器学习(视频)

视频OCR

视频OCR模板可以在视频中框选出含文字部分时,自动对框内文字进行识别。

图像语义分割

机器学习(图像)

图像语义分割

图像语义分割模板可以将图片内容进行分割,并配置题目对分割内容进行打标。

图生文

大模型(多模态)

图生文

图生文模板支持SAM及自研分割算法快速分割图形,结合LLM文本生成能力,探索智能化标注在AIGC场景下的应用。

图文解释

大模型(多模态)

图文解释

图文解释模板用于关联图片选区与文本实体。

对话改写

大模型(大语言模型)

对话改写

对话改写模板可以在给定的主题下对该主题进行提问。您可以选择最合适的机器人回答,并对其进行改写。

多模态RLHF标注-自动问答

大模型(多模态)

多模态RLHF标注

多模态RLHF标注模板提供多模态RLHF标注的功能,在对话改写的基础上,可以接入输入机器人进行自动问答,也可以在手动问答模式输入图片等多模态类型内容。

多模态RLHF标注-输入问答

大模型(多模态)

对话排序

大模型(大语言模型)

对话排序

对话排序模板可以将对话内容进行分类排序。

视觉问答-多轮问答

大模型(多模态)

VQA对话

视觉问答模板可以根据您提供的图片,对图片的内容进行问答,问答均可接入机器人UDF。其中,单轮对话指问题和答案不考虑上下文内容;多轮对话指问题和答案会结合上下文产出。

视觉问答-单轮对话

大模型(多模态)

对话分组

大模型(大语言模型)

对话分组

对话分组模板可以将一系列的对话分为不同的组别,同时支持改写对话。

智能评分

大模型(大语言模型)

智能评分

智能评分模板可以对问答内容进行改写,同时支持针对每道标注的内容配置不同的题目。