语音&VUI
功能概述
语音&VUI功能由若干项子功能组成,有关子功能介绍如下表所示:
子功能项 | 功能描述 |
语音算法服务 | 包含噪音过滤阈值、文字合成语音的语速、音量和语调设置等功能,支持使用系统内置或自定义语音算法服务。 |
静音检测 | 也称VAD阈值,用以对用户侧语音进行断句判定,一般设置为600~800毫秒之间,上限为2000毫秒,过长会导致对话响应变慢。 |
语气承接能力 | 语气承接(Beta版) 允许机器人在回答内容前播放多样的、口语化的语气承接内容,可降低延迟体验、增加对话自然度。 |
优雅打断 | 优雅打断是智能外呼独有的“音义一体”体系的能力之一。基于对比学习、融合语音和语义特征,实现了语义打断、噪音过滤、背景人声过滤等多种能力,可以有效改善机器人被误打断的情况。 |
智能断句 | 智能断句模型融合了人类说话行为的特征、每句话的语音和语义特征,来更准确判断用户表达是否完整、是否只是句中停顿,从而避免错误断句导致的对话错乱。 |
情绪识别 | 整合了语音、语义特征的情绪识别能力,可以更准确的判断用户侧多样的情绪,以便对不同情绪结果进行个性化回应。相比纯文本的情绪识别,会有更好的准确率。 |
用户打断 | 指机器人在播放时用户是否可以打断。对场景中所有对话流生效。 |
功能入口
根据实际业务需求,进入有关业务空间后,选择“场景管理”,进入有关场景;


进入有关场景后,选择“语音&VUI”标签,即可进入有关功能设计界面。

内容配置
语音算法服务
有关语音算法服务内容配置项的含义及系统界面如下图所示:

其它子功能
有关语音&VUI其它子功能内容配置项的含义及系统界面如下图所示:
