全部产品
云市场

简介

更新时间:2019-04-09 19:38:21

泛热词介绍

在语音识别服务中,如果在您的业务领域有一些特有的词,默认识别效果较差的时候可以考虑使用泛热词功能,将这些词添加到词表,改善这部分词的识别结果。

泛热词可以是某个人的姓名、公司名称,也可以是某个领域的专有名词,比如人名“王晓铭”(通常会识别为“王小明”),司法领域的“被上诉人”,电商领域的“包邮”等。一般泛热词不建议太长,也不要有标点符号,具体限制请阅读后续章节,设置后可以看一下识别效果,不满意再调整。

添加的泛热词数量有限,如果需要添加大量的泛热词,建议改用定制模型。

管控台与POP API设置泛热词的区别

  • 使用管控台在项目中配置泛热词,该泛热词是与项目的appkey绑定的,您无需在客户端的代码中指定泛热词表。使用POP API创建泛热词表,需要您在客户端的代码中调用SDK的接口,设置泛热词表的ID,该词表才能生效。
  • 使用管控台在项目中配置泛热词,语料以每个泛热词一行,无需设置泛热词的权重。使用POP API创建泛热词表,需要指定每个泛热词的权重。

应用举例

如果场景中经常出现一些电影名称,为了提高电影名称的识别率,可以将这些电影名称作为热词,添加到项目中,文件下载链接

  1. 肖申克的救赎
  2. 霸王别姬
  3. 这个杀手不太冷
  4. 阿甘正传
  5. 美丽人生
  6. 泰坦尼克号
  7. 千与千寻
  8. 辛德勒的名单
  9. 盗梦空间
  10. 机器人总动员
  11. 忠犬八公的故事
  12. 三傻大闹宝莱坞
  13. 海上钢琴师
  14. 放牛班的春天
  15. 楚门的世界
  16. 教父
  17. 龙猫
  18. 星际穿越