全部产品
云市场
云游戏

管理热词

更新时间:2020-06-16 11:23:35

在语音识别服务中,如果在您的业务领域存在一些特有词汇,默认识别不准确的可以使用热词功能。

热词简介

热词可以是某人的姓名、公司名称或某领域的专有名词,如人名王晓铭(通常会识别为王小明),司法领域的被上诉人,电商领域的包邮等。热词一般不建议太长,具体长度没有严格要求;也不要有标点符号。设置后可测试一下识别效果,不满意再进行调整。

热词的时效性:设置后,新建的语音识别请求立即生效;已经运行的识别请求无法使用该热词。

热词分为泛热词和类热词:

  • 泛热词:管控台项目中的热词类型其他,即泛热词。您可以将识别效果较差的词汇添加到词表,从而改善识别结果。泛热词不限制热词的类别,如苹果、哈士奇、小明可以放在同一热词文件中。

  • 类热词:类热词支持人名地名,与泛热词类似,以词表的形式改进识别结果,效果比泛热词更好。

热词

使用限制

通过管理控制台添加热词时,有如下限制:

  • 目前仅支持中文热词识别。
  • 上传的热词文件为TXT格式,文件不大于100KB,采用无BOM头的UTF-8编码。
  • 每行一句热词,每个热词少于10个字,最多可添加128个热词。
  • 类热词最多可创建10组热词,即人名和地名一共可创建10个词表;泛热词最多可创建10个词表。
  • 词汇中的数字需要按照发音替换为对应的汉字。例如:58.9元需要转换为五十八点九元
  • 文件中不要出现除空格、制表符、换行、换页之外的其他特殊字符。
  • 类热词只有在基础模型为政法模型的基础上有效,其他基础模型暂不支持使用。

创建热词

  1. 添加热词组页面,输入热词组名称并上传热词文件添加热词

  2. 单击确定

    如果上传的文件格式正确,可生成热词表。

  3. 热词模块的下拉列表中选择创建的热词表,单击发布上线,即可立即生效。添加热词成功

说明:管控台项目中选定的热词是与项目appkey自动绑定的,您无需设置,服务端会自动判断和使用该热词。

热词管理

自学习平台 > 热词中管理已创建的热词表。以地名为例,关联项目表示哪些项目正在使用该热词表,一个热词表可以被多个项目使用。您可以对该热词表进行更新、下载或删除操作。

热词列表

您也可以在热词页,单击创建热词,与在项目中创建热词效果相同。