聚类标注方法介绍

本文介绍了聚类标注的具体操作方法。

功能概述

在进行标注前,可通过分析判断待标注内容的特性采取对应的标注策略,即分场景标注;在标注过程中,可通过设置全屏状态,使用快捷键等操作,体验“沉浸式标注”。本文具体介绍此两种标注方法。

分场景标注

直接标注

场景概述

适用于用户问法数量较少、分布相对集中,即时解决问答不命中的场景,可以通过一次标注操作就能完成知识的优化工作。标注动作包括:

  • 正确

  • 错误-修改知识

  • 错误-已处理

  • 未覆盖-新增知识

  • 未覆盖-已处理

  • 无效

  • 待定

标注步骤

  1. 选择高频用户问法:在聚类问法组中选择高频聚类问法,查看用户问法与知识的匹配类型及匹配明细。

    image

  2. 判断用户问法与知识的匹配度:根据用户问法与知识的匹配度判断需要进行的标注操作。

    image

  3. 逐条或批量标注:对同一聚类问法组的多个用户问法直接进行逐条或批量标注。

    image

先标注分类再优化知识

场景概述

适用于用户问法数量较多、分布较为分散,周期性进行知识优化的场景,可以先做一次标注操作对用户问法分类,再集中进行知识优化工作。标注动作包括:

  • 错误-暂不处理

  • 未覆盖-暂不处理

标注完成后,切换到已标注未处理标签下进行集中处理,支持对同种标注结果进行批量处理。

image

标注步骤

  1. 选择用户问法:在聚类问法组中选择高频聚类问法,查看用户问法与知识的匹配类型及匹配明细。image

  2. 先标注分类:可在全屏模式下使用快捷键对用户问法进行快速打标分类:错误-暂不处理、未覆盖-暂不处理。

    标注

    含义

    错误-暂不处理(默认)

    已有知识命中错误,移至已标注未处理集中修改知识。

    未覆盖-暂不处理(默认)

    暂无该知识,移至已标注未处理集中增加知识。

    image

  3. 批量修改或新增知识:在已标注未处理页面对同一聚类问法组下相同匹配类型的多个用户问法进行逐条修改或新增知识。image

沉浸式标注

若同一聚类问法组的用户问法数量较多,可收起聚类问法组点击全屏使用快捷键进行沉浸式标注,提高标注效率。具体操作可参考下图:

image

image..png