标签挖掘

更新时间:
复制为 MD 格式

标签体系作为对话分析的基础,在通话内容基础分析、重复来电分析都会使用到标签体系,为了实现客户可自运营标签体系,并从实际对话中挖掘标签并丰富标签体系的作用。

功能详情

挖掘工具

任务状态:

  • 正在挖掘中:表示该任务仍在进行,该状态不支持用户“删除”;

  • 挖掘完成:表示该任务已经挖掘完成;

  • 挖掘失败:表示该任务挖掘失败,点击查看详情后展示挖掘失败的原因;

操作:

  • 详情:查看该任务的详细信息,点击后可以查看其详情或进行编辑操作;

  • 删除:删除该任务,包括删除该任务对应的挖掘结果,但已经入库的内容不会被删除

  • 新建任务:点击后弹出任务新建窗

新建挖掘任务

支持两种数据源类型:

  • 本地上传:由本地上传语料数据

  • 历史数据:支持选择质检数据集和通过API上传的数据,如离线语音数据等

高级配置:

标签挖掘功能支持用户干预,干预的方式就是通过在高级配置中增加关注词和非关注词。标签挖掘时会提高关注词的权重,同时避免非关注词被挖出

表格

其中本地上传xlsx文件即可进行挖掘任务,也可以下载文件模板到本地进行手动录入

手动录入

文件上传失败会展示失败原因,也可以尝试重新上传

重新上传

当筛选数据少于1000条时会显示提示“数据数量较少,建议1000条以上为宜”,当满足1000条数据时不提醒。

历史数据挖掘:

l数据来源为数据集数据和通过API上传的全部数据(包括在线、热线,实时、离线数据)

l数据来源:支持选择“质检数据集”、“离线语音数据”、“实时语音数据”、“离线文本数据”和“实时文本数据”

选择质检数据集后,允许用户选择数据集质检中的数据集·

选择离线语音数据后,筛选项支持:时间范围、技能组名称、客服姓名、主叫号码、被叫号码、呼叫类型、自定义字段1-13

筛选项历史数据

所选条件内数据如果小于100条会显示暂无数据状态

无数据状态

标签挖掘过程

挖掘状态

当挖掘成功后,页面自动跳转到挖掘结果详情页

当挖掘失败后,页面展示如下内容:

挖掘失败

挖掘结果详情

通过任务详情页查看挖掘结果。

挖掘结果

页面上方显示本次挖掘的综合指标,内容包括:

  • 本次总共处理了X个对话;

  • 共挖掘出XX个业务标签:不包含同义词,例如“个人网银-网上支付-证书支付”和“个人网银-网上支付-证书付款”认为是一个标签;

  • 已处理XX个标签:表示已经保存到标签体系或者判定为失效的总数

  • XX个标签存入标签体系:表示总共存入了多少个标签

  • XX个标签判定为忽略:表示总共多少个标签是忽略的

注:如果挖掘出的标签数量多于20个,需要进行分页

标签

  • 标签名称:展示标签的名称,同时展示层级

  • 标签层级:表示挖掘出的标签是几级的,例如“个人网银-网上支付-证书支付”的标签层级为3级(此处环境下没有展示)

  • 同义词个数:表示该标签共有多少个同义词

忽略标签

“忽略”按钮:点击后弹窗提示用户是否确定失效该标签

用户确定失效后,该标签移至列表最后,并将该标签置灰处理

置灰标签

手动干预主标签切换,同时可以补充同义标签,随后点击“保存至标签体系”

标签入库

标签的详细数据中支持用户编辑,并且通过英文“-”来表示不同层级结果,例如“个人网银-网上支付-证书支付”

标签入库

  • 如果标签的路径与标签体系中有重合,则自动归入到相应位置,并且高亮显示;如果完全没有重合的路径,则放在标签体系的最下面;

  • 同时支持鼠标拖拽的方式编辑该标签的层级位置

  • 挖掘完成后,点击“完成”按钮完成操作并返回挖掘任务列表页,如果本次挖掘更改了标签体系,则弹窗提示用户;如果没有则不提示。