语音识别热词

系统内置STT支持配置热词,通过阅读本文,您可以了解热词功能以及如何配置热词。

功能概述

语音识别热词功能允许用户设定一组特定的词汇作为热词。当语音识别系统运行时,它会优先处理这些热词,提高其在识别过程中的权重。如果您的业务领域有部分词汇识别效果不佳,可以考虑使用热词功能,从而提高识别效果。

使用限制

  • 支持语言:仅支持中文和英文词语。

  • 文件格式:通过控制台上传时,热词文件必须为 UTF-8 编码的 TXT 文件。

  • 内容要求:

    • 一个文件最多包含 500 个热词。

    • 每个热词最长不超过 10 个字符。

    • 词语之间必须换行,且不能包含标点符号或特殊字符。

  • 文件大小:热词文件大小不能超过 100 KB。

功能配置

您可以根据业务需求,选择通过控制台、OpenAPI 或客户端 SDK 配置热词。不同配置方式的生效范围和优先级如下:

  • 控制台配置:全局生效,对工作流下的所有通话实例生效。

  • OpenAPI/客户端 SDK 配置:实例级别生效,仅对当前通话实例生效。

说明

通过 OpenAPI 或客户端 SDK 配置的热词,将覆盖在控制台上配置的热词。

控制台配置

  1. 准备热词文件:将您需要先识别的关键词放到一个TXT文件,示例如下:

    肖申克的救赎
    霸王别姬
    这个杀手不太冷
    阿甘正传
    美丽人生
    泰坦尼克号
    千与千寻
    辛德勒的名单
    盗梦空间
    机器人总动员
  2. 配置STT节点:将您准备好的热词文件上传到实时工作流STT节点中。

    image

  3. 热词生效:上传热词文件后,您需要执行保存或创建工作流后才能生效。

OpenAPI配置

您也可以通过调用OpenAPI接口的方式,配置实例级别的语音识别热词。您需要在调用GenerateAIAgentCall - 生成AI智能体通话实例接口时,通过传入中的AIAgentConfig.AsrConfig.AsrHotWords实现。详情请参见AIAgentConfig

说明

通过OpenAPI配置的热词将会覆盖控制台配置的热词。

客户端启动时配置

AICallKit SDK支持在通话实例级别的热词配置。

Android

// 创建通话配置对象
ARTCAICallEngine.ARTCAICallConfig artcaiCallConfig = new ARTCAICallEngine.ARTCAICallConfig();
 
// 设置热词列表
artcaiCallConfig.agentConfig.asrConfig.asrHotWords = {"xxx", "yyy"};

//省略发起通话流程
... 

iOS

// 创建智能体配置对象
let agentConfig = ARTCAICallAgentConfig()

// 设置热词列表
agentConfig.asrConfig.asrHotWords = ["xxx", "yyy"]

// 为通话配置设置智能体配置
callConfig.agentConfig = agentConfig

//省略发起通话流程
... 

Web

// 创建智能体配置对象
const agentConfig = new AICallAgentConfig();

// 设置热词列表
agentConfig.asrConfig.asrHotWords = ["xxx", "yyy"];

// 为通话配置设置智能体配置
callConfig.agentConfig = agentConfig

//省略发起通话流程
...