全部产品
云市场

管理热词

更新时间:2019-10-23 17:48:52

热词介绍

在语音识别服务中,如果在您的业务领域有一些特有的词,默认识别不出来的时候可以考虑使用热词功能。

热词可以是某个人的姓名、公司名称,也可以是某个领域的专有名词,比如人名王晓铭(通常会识别为王小明),司法领域的被上诉人,电商领域的包邮等。一般热词不建议太长,也不要有标点符号。具体长度没有严格的要求,设置后可以看一下识别效果,不满意再调整。

热词的时效性:设置后新建的识别请求立即生效,已经正在运行的识别请求无法使用该热词。

热词可分为泛热词和类热词:

  • 泛热词:管控台项目中的热词类型其他即泛热词。您可以将识别效果较差的词语添加到词表,改善这部分词的识别结果。泛热词不限制热词的类别,如苹果、哈士奇、小明可以放在一个热词文件中。

  • 类热词:与泛热词类似,以词表的形式改进识别结果。类热词只支持人名和地名,效果比泛热词更好。

热词

通过控制台添加热词

使用限制:

  • 上传的热词文件为txt格式,100KB以内,无BOM头的UTF-8编码。
  • 每行一句热词,每个热词要少于10个字,最多可添加128个热词。
  • 类热词最多可创建10组热词,即人名和地名一共可创建10个词表。泛热词,即其他,最多可创建10个词表。
  • 词语中的数字需要按照发音替换为对应的汉字。例如:58.9元需要转换为五十八点九元
  • 文件内容中请不要出现除空格、制表符、换行、换页之外的其他特殊字符。
  • 类热词只有在基础模型为政法模型的基础上有效,其他基础模型下不能使用。
  • 目前仅支持中文热词识别。

添加热词

点击确定,如果上传的热词文件没有问题,即可生成人名的热词表,在下拉列表中选择创建的热词表,点击发布上线,即可立即生效(正在运行的识别任务不能使用该热词表)。

添加热词成功

说明:管控台项目中选定的热词是与项目绑定的,您在客户端使用的appkey自动绑定了该项目下的热词,您无需自己设置,服务端会主动判断和使用该热词。

热词管理

我的资源-热词中可以管理已创建的热词表。以人名为例,关联项目表示哪些项目正在使用该热词表,一个热词表可以被多个项目使用。您可以对该热词表进行更新(重新上传热词文件)、下载、删除。

热词列表

您也可以在这里点击创建热词,直接创建热词表,与在项目中创建相同。