文档

概述

更新时间:
一键部署

本文主要介绍如何通过API管理热词。 在通义听悟的语音转写中,如果您的业务领域有部分词汇默认识别效果不够好,可以考虑使用热词功能,将这些词添加到热词词表从而改善语音识别效果。

使用须知

  • 目前仅支持中文热词识别。

  • 每个用户默认最多创建10个热词词表。

  • 每个词表最多包含300个热词,每个热词长度不超过10个字符。

  • 热词必须为UTF-8编码,不能包含标点、特殊字符。

  • 热词对应的权重取值范围为[-6,5]之间的整数。

  • 文本中的数字需要按照发音替换为对应的汉字。例如:“58.9元”需要替换为“五十八点九元”。

说明
  • 取值大于0会增大该词语被识别的概率,小于0会减小该词语被识别的概率。

  • 取值为-6:表示尽量不要识别出该词语。

  • 取值为2:常用值。

  • 如果效果不明显可以适当增加权重,但是当权重较大时可能会引起负面效果,导致其他词语识别不准确。

交互流程

image.png

前提条件

AccessKey环境变量设置

需要使用您的AccessKey的Id和secret替换如下命令中的YOUR_ACCESS_KEY_ID和YOUR_ACCESS_KEY_SECRET。

export ALIBABA_CLOUD_ACCESS_KEY_ID=YOUR_ACCESS_KEY_ID &&
export ALIBABA_CLOUD_ACCESS_KEY_SECRET=YOUR_ACCESS_KEY_SECRET

接入步骤

用户从客户端提交创建热词词表的请求。

正常情况下,服务端返回创建完成的热词词表PhraseId,用于后续的语音识别任务。

如果调用出错,响应报文中会给出相关错误信息,以及RequestId,您可自行据此排查调用参数,也可以将响应报文通过工单形式提交给我们做进一步排查。

  • 使用热词词表

当提交音视频文件离线转写请求或实时记录请求时,传入上一步创建成功的热词词表PhraseId,将PhraseId添加到创建听悟任务的Transcription参数中从而改善语音识别效果。

参数名

类型

是否必填

说明

Transcription.PhraseId

String

热词词表ID。

根据热词词表的PhraseId获取该词表的详细热词以及对应权重信息。

根据热词词表的PhraseId更新对应的词表信息,包括词表名称、词表描述信息、词表内的热词和对应权重。

根据热词词表的PhraseId删除对应的词表。

根据用户UID列举出该用户的所有热词词表,包括词表PhraseId、词表名称以及词表描述。