聚类标注方法介绍

在进行标注前,可通过分析判断待标注内容的特性采取对应的标注策略,即分场景标注;在标注过程中,可通过设置全屏状态,使用快捷键等操作,体验“沉浸式标注”。本文具体介绍此两种标注方法。

分场景标注

场景一:直接标注

场景概述

适用于用户问法数量较少、分布相对集中,即时解决问答不命中的场景,可以通过一次标注操作就能完成知识的优化工作。标注动作包括:

  • 正确

  • 错误-修改知识

  • 错误-已处理

  • 未覆盖-新增知识

  • 未覆盖-已处理

  • 无效

  • 待定

标注步骤

第1步:选择高频用户问法

在【聚类问法组】中选择高频聚类问法,查看用户问法与知识的匹配类型及匹配明细。

image

第2步:判断用户问法与知识的匹配度

根据用户问法与知识的匹配度判断需要进行的标注操作。

image

第3步:逐条或批量标注

对同一聚类问法组的多个用户问法直接进行逐条或批量标注。

image

场景二:先标注分类再优化知识

场景概述

适用于用户问法数量较多、分布较为分散,周期性进行知识优化的场景,可以先做一次标注操作对用户问法分类,再集中进行知识优化工作。标注动作包括:

  • 错误-暂不处理

  • 未覆盖-暂不处理

标注完成后,切换到【已标注未处理】标签下进行集中处理,支持对同种标注结果进行批量处理。

image

标注步骤

第1步:选择用户问法

在【聚类问法组】中选择高频聚类问法,查看用户问法与知识的匹配类型及匹配明细。image

第2步:先标注分类

可在全屏模式下使用快捷键对用户问法进行快速打标分类:错误-暂不处理、未覆盖-暂不处理。

标注

含义

错误-暂不处理(默认)

已有知识命中错误,移至【已标注未处理】集中修改知识。

未覆盖-暂不处理(默认)

暂无该知识,移至【已标注未处理】集中增加知识。

image

第3步:批量修改或新增知识

在【已标注未处理】页面对同一聚类问法组下相同匹配类型的多个用户问法进行逐条修改或新增知识。image

沉浸式标注

若同一聚类问法组的用户问法数量较多,可收起聚类问法组点击全屏使用快捷键进行沉浸式标注,提高标注效率。具体操作可参考下图:

image..pngimage..png