文档

热词模型

更新时间:

语音转文字时,如果在您的业务领域有一些特有的词,默认识别效果较差的时候可以考虑使用热词模型功能,将这些词添加为热词,改善这部分词的识别结果。热词组设置后无需训练即可生效,只需在语音转文字时(也就是新建数据集质检任务时,以及 上传音频质检) 时选择对应的热词组就可以使用了。

热词要求

热词可以是某个人的姓名、公司名称,也可以是某个领域的专有名词,比如人名“王晓铭”(通常会识别为“王小明”),司法领域的“被上诉人”,电商领域的“包邮”等。一般热词不建议太长,也不要有标点符号,设置后可以看一下识别效果,不满意再调整。热词的具体要求如下:

  1. 热词只能包含汉字,词语中的数字需要按照发音替换为对应的汉字。例如:58.9元需要转换为五十八点九元。

  2. 每个词最多不超过10个字,每个热词组最多包含128个热词。

视频讲解

操作流程

新建热词组

  1. 点击新建热词模型列表上方的 新建热词组 按钮,需要注意的是,当前每个用户最多可创建5个热词组;2

  2. 填写热词组名称以及热词后,点击左下角的 确定 按钮即可;33

热词组的更新与删除

  • 通过热词组列表最右侧的 更新 按钮,可以对已有热词组进行修改更新。

  • 通过热词组列表最右侧的 删除 按钮,可以对已有热词组进行删除,删除后无法恢复,请谨慎操作。

  • 本页导读 (0)
文档反馈