语义挖掘工具
语义挖掘工具是通过对批量对话信息进行挖掘,聚类出这些对话中的意图,并将对话中的话术归入系统意图中。
新建任务
点击语义挖掘工具右上角的新建任务即可唤出新建语义挖掘任务的弹窗,输入任务名称并选择数据源并按照数据源类型操作完成后即可完成创建。在创建任务时系统支持选择本地上传和历史数据两种数据源。
本地上传:由本地上传语料数据,目前系统仅支持txt格式 、文件编码为UTF-8且每一行为独立的一句语料的文件。
历史数据:可以选择已经执行过质检任务的历史数据,包括呼叫中心质检的离线质检数,以及数据集质检数据。
注:数据最长存储90天,所以只能选择90天内的日期,超过90天的数据会自动清除,无法找回,建议您定期导出数据进行本地存储。
任务创建完点击开始分析后就可以在语义挖掘工具的列表中找到新建的任务。

注:
语义分析会将数据分析到现有意图中,现有意图可以在意图管理中进行管理。
系统单次挖掘的数据上限为1000条。
语义分析
点击语义挖掘工具列表数据右侧的查看详情即可进入到语义分析页面。
【分析结果】
数据总量:表示进行语义挖掘的数据总量
命中意图:表示进行语义挖掘时命中的意图的数量
命中条数:表示进行语义挖掘时有效命中意图数据的全部数量
未命中条数:表示进行语义挖掘时无法有效命中意图数据的全部数量
【命中意图】
在命中意图的列表中可以对命中该意图的原话术数据进行修改,即点击对应意图右侧的修改按钮。
通过修改可以将系统命中错误的话术数据修正到现有意图中,现有意图可以在意图管理中进行管理。
点击列表右侧的调整意图即可开始选择现有意图,选择后记得点击右侧的提交按钮进行确认。
除了在语义分析中对命中意图修改完成后点击右下角的下一步按钮进入语义挖掘页面。
语义挖掘
在语义挖掘中可以将未命中意图的句子进行聚类挖掘,并展示在类别明细列表中。
【挖掘结果】
处理语句总数:表示进行语义挖掘的话术数据总数,即对应了语义分析中的未命中条数
聚出类别个数:表示系统进行挖掘后聚类出意图相近的类别簇数
最多数量的类别共:表示系统进行挖掘后聚类出的所有类别簇数中占比最多的句子数量
最少数量的类别共:表示系统进行挖掘后聚类出的所有类别簇数中占比最少的句子数量
已处理语句:表示在下面类别明细中已经进行处理的数量
新建意图:表示在下面类别明细中已经将话术数据绑定到新意图的数量
归入已有意图:表示在下面类别明细中已经将话术数据绑定到已有意图的数量

【类别明细】
在类别明细的列表中系统默认以簇分数进行倒序展示,并将已完成修改的类别移到最后。
在明细中系统会按挖掘聚类出的类别簇选取出一句代表句,并将句子中的关键词、句子总数和簇的分数进行展示。

点击每个类别中右侧的查看详情即可对挖掘出的句子进行意图划分。
在勾选要处理的句子后根据意图情况选择归入新建意图或归入已有意图。当选择归入新建意图时,新建的意图会自动同步至意图管理中;当选择归入已有意图时,意图标题就只能选择意图管理中的意图。
已有意图详情可参见:意图管理
将挖掘出的意图处理完成后点击右下角的完成,即可完成本次的语义挖掘工作。
语义挖掘完成后,还可以在列表中通过查看详情继续对该数据进行语义分析和语义挖掘。