系统内置STT支持配置热词,通过阅读本文,您可以了解热词功能以及如何配置热词。
功能概述
语音识别热词功能允许用户设定一组特定的词汇作为热词。当语音识别系统运行时,它会优先处理这些热词,提高其在识别过程中的权重。如果您的业务领域有部分词汇识别效果不佳,可以考虑使用热词功能,从而提高识别效果。
使用限制
-
支持语言:仅支持中文和英文词语。
-
文件格式:通过控制台上传时,热词文件必须为
UTF-8编码的 TXT 文件。 -
内容要求:
-
一个文件最多包含 500 个热词。
-
每个热词最长不超过 10 个字符。
-
词语之间必须换行,且不能包含标点符号或特殊字符。
-
-
文件大小:热词文件大小不能超过 100 KB。
功能配置
您可以根据业务需求,选择通过控制台、OpenAPI 或客户端 SDK 配置热词。不同配置方式的生效范围和优先级如下:
-
控制台配置:全局生效,对工作流下的所有通话实例生效。
-
OpenAPI/客户端 SDK 配置:实例级别生效,仅对当前通话实例生效。
通过 OpenAPI 或客户端 SDK 配置的热词,将覆盖在控制台上配置的热词。
控制台配置
-
准备热词文件:将您需要先识别的关键词放到一个TXT文件,示例如下:
肖申克的救赎 霸王别姬 这个杀手不太冷 阿甘正传 美丽人生 泰坦尼克号 千与千寻 辛德勒的名单 盗梦空间 机器人总动员 -
配置STT节点:将您准备好的热词文件上传到实时工作流STT节点中。
在 STT 节点配置面板的自定义热词区域,单击上传链接上传热词文件。文件要求:TXT 格式、500 个词以内、每个词不超过 10 个字符、文件大小 100KB 以内、UTF-8(无 BOM)编码。可单击点击下载样例获取模板。
-
热词生效:上传热词文件后,您需要执行保存或创建工作流后才能生效。
OpenAPI配置
您也可以通过调用OpenAPI接口的方式,配置实例级别的语音识别热词。您需要在调用生成AI智能体通话实例接口时,通过传入中的AIAgentConfig.AsrConfig.AsrHotWords实现。详情请参见AIAgentConfig。
通过OpenAPI配置的热词将会覆盖控制台配置的热词。
客户端启动时配置
AICallKit SDK支持在通话实例级别的热词配置。
Android
// 创建通话配置对象
ARTCAICallEngine.ARTCAICallConfig artcaiCallConfig = new ARTCAICallEngine.ARTCAICallConfig();
// 设置热词列表
artcaiCallConfig.agentConfig.asrConfig.asrHotWords = new ArrayList<String>() {{ add("xxx"); add("yyy");}};
//省略发起通话流程
...
iOS
// 创建智能体配置对象
let agentConfig = ARTCAICallAgentConfig()
// 设置热词列表
agentConfig.asrConfig.asrHotWords = ["xxx", "yyy"]
// 为通话配置设置智能体配置
callConfig.agentConfig = agentConfig
//省略发起通话流程
...
Web
// 创建智能体配置对象
const agentConfig = new AICallAgentConfig();
// 设置热词列表
agentConfig.asrConfig.asrHotWords = ["xxx", "yyy"];
// 为通话配置设置智能体配置
callConfig.agentConfig = agentConfig
//省略发起通话流程
...