本文主要介绍如何通过API管理热词。 在通义听悟的语音转写中,如果您的业务领域有部分词汇默认识别效果不够好,可以考虑使用热词功能,将这些词添加到热词词表从而改善语音识别效果。
使用须知
目前仅支持中文热词识别。
每个用户默认最多创建10个热词词表。
每个词表最多包含300个热词,每个热词长度不超过10个字符。
热词必须为UTF-8编码,不能包含标点、特殊字符。
热词对应的权重取值范围为[-6,5]之间的整数。
文本中的数字需要按照发音替换为对应的汉字。例如:“58.9元”需要替换为“五十八点九元”。
取值大于0会增大该词语被识别的概率,小于0会减小该词语被识别的概率。
取值为-6:表示尽量不要识别出该词语。
取值为2:常用值。
如果效果不明显可以适当增加权重,但是当权重较大时可能会引起负面效果,导致其他词语识别不准确。
交互流程
前提条件
AccessKey环境变量设置
需要使用您的AccessKey的Id和secret替换如下命令中的YOUR_ACCESS_KEY_ID和YOUR_ACCESS_KEY_SECRET。
export ALIBABA_CLOUD_ACCESS_KEY_ID=YOUR_ACCESS_KEY_ID &&
export ALIBABA_CLOUD_ACCESS_KEY_SECRET=YOUR_ACCESS_KEY_SECRET
接入步骤
用户从客户端提交创建热词词表的请求。
正常情况下,服务端返回创建完成的热词词表PhraseId,用于后续的语音识别任务。
如果调用出错,响应报文中会给出相关错误信息,以及RequestId,您可自行据此排查调用参数,也可以将响应报文通过工单形式提交给我们做进一步排查。
使用热词词表
当提交音视频文件离线转写请求或实时记录请求时,传入上一步创建成功的热词词表PhraseId,将PhraseId添加到创建听悟任务的Transcription参数中从而改善语音识别效果。
参数名 | 类型 | 是否必填 | 说明 |
Transcription.PhraseId | String | 否 | 热词词表ID。 |
根据热词词表的PhraseId获取该词表的详细热词以及对应权重信息。
根据热词词表的PhraseId更新对应的词表信息,包括词表名称、词表描述信息、词表内的热词和对应权重。
根据热词词表的PhraseId删除对应的词表。
根据用户UID列举出该用户的所有热词词表,包括词表PhraseId、词表名称以及词表描述。