本文详细介绍了标注任务的新建方式(人工标注/AI标注)、优化标注任务(人工优化/AI智能优化)、标注任务的数据统计、优化验证以及标注维度管理。
功能概述
标注任务是指通过人工/AI确认机器人给出的回答的准确性,并可借助维度模板自定义评价标准和维度,对机器人对话效果进行标注与优化的工作。首先由系统基于测试环境下的机器人知识,根据人工上传测试集(包含测试问句)批量得到机器人答案,再由人工/AI完成标注、优化和验证。标注任务功能一方面可以明确当前机器人具体的使用效果,从而确保C端用户的良好体验;另一方面,它还为机器人的优化提供了重要的数据参考。
新建标注任务
标注的数据维度为T-1的时间数据(即实时数据无法进行任务标注创建),如果需要实时数据和单条数据标注,可进入日志标注进行操作。
人工标注
登录智能对话机器人管理控制台,进入具体机器人空间,选择标注中心>标注任务进入标注任务管理界面。
单击新建标注任务,进入新建标注任务窗口,选择人工标注,填写相关数据。
任务名称:即标注任务名字,系统默认任务名称为:标注任务-当前时间。
标注维度:系统内置问答满意度、改写满意度、召回满意度、生成满意度四个维度模板供用户选择。默认填充问答满意度。用户可以在标注维度管理中根据自身业务需求新建标注维度。
数据来源:即测评任务需测评的用户问句的数据来源,包括线上日志、线下导入、黄金测评集三种来源。
线上日志导入:即正式环境下用户的问答数据,可分为测试窗和C端。测试窗是指在产品测试窗内发生的与机器人的对话数据;C端是指线上真实终端用户与机器人发生的对话数据。此外,可进一步根据以下条件来筛选需标注的数据:
时间范围:即与机器人对话发生的时间范围。可选择全部或按照自定义时间范围进行筛选。
样本抽样:包含全量标注、比例抽样和自定义量三种模式。
全量标注:拉取全量的线上会话数据进行标注。
比例抽样:根据线上会话数据的量,抽取一定的比例来进行标注。
自定义量:根据自定义的数量,从线上会话数据中随机抽取对应量的数据。
过滤已标注会话:同一时间段内,开启表示过滤已经标注的对话数据后再进行筛选,关闭表示对当前时间段的所有数据进行筛选。
当选择的时间段内的数据都已经创建标注,且开启过滤已标注会话开关,会导致创建标注任务失败。
用户满意度:可选全部、点赞、点踩。点赞和点踩为终端用户在与机器人对话时对机器人答案的评价。
机器人回复类型:提供全部和仅无答案两个选项供用户选择。
全部:在标注机器人问答的时候筛选线上的全部问答数据。
仅无答案:在标注机器人问答的时候筛选线上仅无答案回复的问答数据。
是否转人工:会话session中有一轮转人工即会筛选出来标注,可选全部、是、否。
线下导入:即从本地导入待测评数据。
测试环境:当处于关闭状态时,用正式环境批量跑数据。
服务模拟:启用后,调用API插件返回的值并非取自接口的数据,而是直接返回API插件的mock值。更多详细内容请参见API插件。
导入测评数据文件扩展名需为xls或xlsx,最大支持20MB;上传数据需要符合既定的格式,可下载规范模板进行填写。用户问法为必填字段,其他字段根据需求选填,请勿在其他列填写无关内容。具体格式可参考黄金测评集规范模板。
黄金测评集:即从黄金测评集中导入待测评数据。可选择已有黄金测评集或进行新建,有关黄金测评集的详细介绍请参见黄金测评集。
单击确定,即可完成标注任务创建。
单击已有标注任务右侧操作栏的导出、删除,即可完成相关操作。
AI标注
通过AI帮助用户自动标注选定的对话,用户可以进行复核,标注准确率90%+。可以在当前页面查看当月AI标注剩余额度。
体验版不支持AI标注,敏捷版和标准版提供400次AI自动标注的免费额度,企业版、平台版、旗舰版提供1000次自动标注的免费额度。
在新建标注任务界面选择AI标注,填写相关数据。具体填写方式可参见人工标注中的数据填写。AI自动标注暂时仅支持对提供期望答案的数据源进行标注。创建的AI标注任务在进行优化标注任务时只需要对当前会话按照标注维度进行打标即可。
优化标注任务
登录智能对话机器人管理控制台,进入具体机器人空间,选择标注中心>标注任务进入标注任务管理界面。
在标注任务管理界面,单击标注任务右侧标注,即可进入标注任务界面。
标注任务创建完成后,系统需要一定时间生成机器人答案(标注测评数据越多,系统生成答案耗时越长)。系统答案未生成前,标注任务状态为执行中;系统答案生成完成后,标注任务状态为标注中,此时方可进行标注操作。
在标注任务界面,根据实际业务需求完成会话打标。当前标注界面可分为三个模块,每个模块的功能及含义如下:
单击完成并结束任务,系统弹出提示框,提示当前标注任务数据(已标注通话数|总通话数、问答满意度标注数据),完成标注后当前任务将无法进行标注,但是可以进行智能优化。
单击OK即可完标注。
人工优化
标注为满意时,支持添加高频知识进行再次优化。链接到高频问题管理界面,通过补充或优化有关高频问答知识来优化问答效果。具体操作请参见高频问答知识。
召回干预:用于干预使用已配置的知识回复用户问句,即强制机器人用指定知识回复有关用户问句。
用户问句:即机器人无法正确召回已配置知识回复的用户问句。
匹配类型:能够回应用户问句的知识所属类型。
匹配知识:能够回应用户问句的知识。
AI智能优化
在标注模块对当前会话标注为不满意/一般时,支持对当前会话进行AI智能优化。AI智能优化会生成优化建议与分析详情,同时会自动生成已进行评分的推荐内容供用户采纳,优化方式包含添加实体和SQL干预。
在标注模块选择不满意/一般,单击AI智能优化进入优化页面。
选择期望优化对象,填写期望答案,单击AI智能优化开始进行自动优化。
期望优化对象:期望机器人从什么知识库类型中优化答案,可选择文档或数据表知识库类型。
文档:采纳推荐内容后会进行实体名称(实体成员)添加。
数据表:采纳推荐内容后会进行SQL干预。
期望答案:输入期望答案,可以让AI基于此进行分析,发现问题原因,从而推荐合适的优化手段。
选择需要的内容,单击采纳完成实体名称(实体成员)添加。
优化验证
完成标注任务优化后可进行优化验证。
单击标注任务操作列优化验证,填写任务名称与验证范围。
任务名称:即优化验证任务名称,系统默认任务名称为:标注任务-当前时间。
验证范围:可选当前标注任务创建时的标注维度。
单击确定完成优化验证任务创建。
单击优化验证任务操作列标注进入优化验证任务标注页面,对当前优化验证任务进行标注,标注的相关操作请参见本文档优化验证任务部分。
标注任务数据统计
完成标注任务后,单击标注任务右侧的数据统计,即可查看标注数据。
标注维度管理
在标注任务界面,单击标注维度管理,进入维度模板管理界面。
单击新建标注维度,在新建维度模板界面,根据实际业务需求填写维度名称、量级、维度说明与描述。
维度名称:即评价机器人会话效果维度的名字,如“答案满意度、答案冗余度”。
量级:即评价机器人在该维度上会话效果的等级,最多可选量级为5。例如设置量级为3,那么对应的可添加描述的数量也为3。
维度说明:对维度的进一步解释说明。
添加描述:设置量级下对应的具体内容。
维度名称:设置机器人会话效果评价维度名称为答案满意度。
量级:此处量级设置为3。
描述:则对应量级下可填3个描述:满意、一般、较差。
单击创建,完成维度模板新建。
单击自定义标注维度右侧查看/编辑/删除,即可查看/编辑/删除对应维度模板信息。系统预置标注维度仅支持查看。
- 本页导读 (1)
- 功能概述
- 新建标注任务
- 人工标注
- AI标注
- 优化标注任务
- 人工优化
- AI智能优化
- 优化验证
- 标注任务数据统计
- 标注维度管理