聚类标注功能使用介绍

功能介绍

智能对话机器人上线使用过程中发生的机器人与用户间“错误交互”,可通过完成机器人与用户间的“问答标注”进行优化,从而可提升机器人回答准确率,进而可优化用户体验。

当前支持两种类型的“问答标注”:聚类标注任务标注。聚类标注是指:系统会对近三个月的用户会话日志中,机器人回复澄清答案或未回复答案时对应的用户问法语句,按照语义相似度进行分钟级实时聚类,客户基于在聚类后的用户问法进行的标注。

说明
  • 错误交互:即在用户输出问题语句之后,机器人未能从正面正确地回复用户问题。

  • 问答标注:即对机器人与用户问答内容的标注。标注实质上是一种判断,对机器人与用户问答内容的标注操作大致有“正确、错误、未覆盖、无效、待定”这五类,具体标注操作含义与步骤参见本文“基本功能实现介绍”部分。

  • 聚类:广义上指将物理或抽象对象的集合分成由类似的对象组成的多个类。此处指将用户输出语句按照语义相似度分成由类似的语句组成的“聚类问法组”。

  • 聚类标注结果会通过优化知识数据而优化算法和匹配机制的运用效果,但并不会直接作用于算法和匹配机制。

基本功能实现介绍

功能入口

在左侧导航栏,选择运营中心>问答标注>聚类标注,进入聚类标注界面,具体界面如下:

image..png

待标注内容查看

  1. 进入聚类标注界面后,点击“待标注”标签,进入待标注界面;

  2. 根据实际业务需求选择待标注数据筛选条件后,点击“搜索”按钮即可查看待标注内容

image..png

  • 筛选条件具体含义解释如下:

    • 机器人:默认查询全部机器人,如果有指定机器人,可以选择需要查询的机器人,支持多选。

    • 匹配类型:默认查询全部匹配类型,包括无答案、澄清,如果有指定匹配类型,可以进行选择,支持多选。

    • 关键词:默认为空,可以输入关键词,模糊匹配出包含该关键词的聚类问法组。

    • 答案视角:默认全部视角,支持多选。

    • 更新时间:数据发生变化的时间,数据变化来自用户问法的产生、标注操作或合并累加,可查询近三个月数据。

  • 待标注内容中有关标题解释如下:

    • 聚类问法组:借助聚类算法将语义相近的用户问法进行分类,每种类别称为一个问法组,对应的数字表示该问法组包含的用户问法数;

    • 用户问法:显示用户会话日志中聚类后的用户问题及数量;

    • 匹配类型:显示用户问法与机器人绑定知识的匹配关系,帮助您判断用户问法的合理性以及是否需要优化知识,具体上匹配类型有“澄清”和“无答案”两类;

    • 匹配明细:显示用户问法与机器人绑定知识的详细匹配逻辑,帮助您进一步判断知识存在的问题以便于更好地进行优化;

    • 操作:即标注类型,您可以根据用户问法与知识的匹配情况进行标注。

说明
  • 系统会自动对近三个月的用户会话日志按照语义相似度进行分钟级实时聚类,此聚类内容即是待标注内容的来源。

  • 待标注内容有关数据默认都是查询最近一个月,最多查询近3个月,聚类后未标注的用户问法数,不随查询条件改变而改变,但其具体内容展示随查询条件改变而改变;

  • 在聚类标注界面的“已标注”和“已待定”标签下的筛选条件标注内容有关标题含义同上,后不再单独做解释。

待标注操作类型选择

  1. 进入聚类标注界面后,点击待标注标签,进入待标注界面;

  2. 根据实际业务需求选择待标注数据筛选条件后,点击操作栏下对应的操作按钮即可完成用户语句标注。

image..png

当前九种标注类型含义解释如下:

标注类型

含义

正确

用户问法和匹配类型准确无误。

错误-暂不处理(默认)

已有知识命中错误,移至【已标注未处理】集中修改知识。

错误-修该知识

已有知识命中错误,立即修改。

错误-已处理

已修正知识,历史日志命中错误,标记为已处理。

未覆盖-暂不处理(默认)

暂无该知识,移至【已标注未处理】集中增加知识。

未覆盖-新增知识

暂无该知识,立即新增。

未覆盖-已处理

已新增知识,历史日志未命中,标记为已处理。

无效

用户问法无意义,忽略。

待定

用户问法不明确,待定。

说明
  • 在标注过程中点击“错误”或“未覆盖”按钮时,系统默认是对用户语句进行“错误-暂不处理”或“未覆盖-暂不处理”操作。

  • 有关此九种标注类型的具体操作演示与执行后标注语句数据流向详见聚类标注操作类型介绍

  • 刷新逻辑同一聚类问法组中所有用户问法均标注完成后,刷新后(点击刷新图标或切换标签或右键刷新页面)该聚类问法组会进入的相应的标签,待标注标签上用户问法数相应减少。

  • 若已标注未刷新,可在“待标注”标签下重新标注为除当前标注类型外的其他标注类型。

已标注内容查看

  • “已标注-未处理”内容查看

“已标注-未处理"标签下展示历史累积标注为“错误-暂不处理”、“未覆盖-暂不处理”且截止到当前仍未处理的用户问法及数量。具体内容查看可参考如下步骤:

  1. 进入聚类标注界面后,点击已标注>未处理标签,进入“已标注-未处理”界面;

  2. 根据实际业务需求选择数据筛选条件后,点击“搜索”按钮即可查看“已标注-未处理”内容。

image..png

  • “已标注-已处理”内容查看

“已标注-已处理"标签下展示历史累积标注为“正确、错误-已修改知识、错误-已处理、未覆盖-新增知识、未覆盖-已处理或无效”的用户问法及数量。具体内容查看可参考如下步骤:

  1. 进入聚类标注界面后,点击已标注>已处理标签,进入“已标注-已处理”界面;

  2. 根据实际业务需求选择数据筛选条件后,点击“搜索”按钮即可查看“已标注-已处理”内容。

image..png

说明
  • 已标注内容有关数据默认展示最近一个月已标注过的用户问法,小括号中的数字表示历史累积标注过的聚类用户问法数。最长可查询时间为一年。

  • 标注对知识影响数据查看

  1. 进入聚类标注界面后,点击已标注>已处理标签,进入“已标注-已处理”界面;

  2. 根据实际业务需求选择数据筛选条件后,点击“搜索”按钮即可查看标注对知识影响数据。

image..png

各数据指标的具体含义如下表所示:

指标

含义

新增FAQ知识数

通过聚类标注累积新增的FAQ知识数量,计算新建知识数时会去重。

添加FAQ相似问法数

通过聚类标注累积添加的FAQ相似问法数量。

绑定意图问法数

通过聚类标注累积绑定到对话工厂意图的用户问法数量。

绑定表格问法数

通过聚类标注累积绑定到表格的用户问法数量。

绑定闲聊相似问法数

通过聚类标注累积添加的闲聊相似问法数量。

全局拒识问法数

通过聚类标注累积设置为全局拒识的用户问法数量。

已标注结果修改

若您需要对已标注的用户问法进行重新标注,可在已标注标签找到需重新标注的用户问法,根据实际业务需求进行重新标注。不同标注结果所支持重新标注类型如下表所示:

标注结果

操作

正确

错误-暂不处理、错误-修改知识、错误-已处理、未覆盖-暂不处理、未覆盖-新增知识、未覆盖-已处理、无效、待定

错误-修该知识

错误-修改知识

错误-已处理

正确、错误-暂不处理、错误-修改知识、未覆盖-暂不处理、未覆盖-新增知识、未覆盖-已处理、无效、待定

未覆盖-新增知识

为标注终态,不可再次标注

未覆盖-已处理

正确、错误-暂不处理、错误-修改知识、错误-已处理、未覆盖-暂不处理、未覆盖-新增知识、无效、待定

无效

正确、错误-暂不处理、错误-修改知识、错误-已处理、未覆盖-暂不处理、未覆盖-新增知识、未覆盖-已处理、待定

待定

正确、错误-暂不处理、错误-修改知识、错误-已处理、未覆盖-暂不处理、未覆盖-新增知识、未覆盖-已处理、无效

特殊的,当原用户语句标注结果为错误-修改知识时,重新标注操作类型只能是错误-修改知识;当原用户语句标注结果为未覆盖-新增知识时,无法对对应用户语句进行重新标注。具体系统界面如下图所示:

  • 未覆盖-新增知识:标注终态,不可再次标注

image..png

  • 错误-修改知识:可再次修改知识。

image..png

已待定内容查看

“已待定"标签下默认展示最近一个月标注为待定的用户问法,具体内容查看步骤如下:

  1. 进入聚类标注界面后,点击“已待定”标签,进入已待定界面;

  2. 根据实际业务需求选择待标注数据筛选条件后,点击“搜索”按钮即可查看已待定内容。

image..png

说明
  • 已待定内容有关数据默认展示最近一个月,最长可查询时间为一年。

  • 点击“下载”按钮可对标注结果为“已待定”的数据下载(单次下载数据上限为一万条)。

已待定操作类型选择

若您需要对已待定的用户问法进行标注,可在已待定标签下找到需标注的用户问法,根据实际业务需求进行标注。具体操作步骤如下:

  1. 进入聚类标注界面后,点击“已待定”标签,进入已待定界面;

  2. 根据实际业务需求完成已待定数据筛选条件后,点击操作栏下对应的操作按钮即可完成用户语句标注。

image..png