功能概述
语音&VUI功能由若干项子功能组成,有关子功能介绍如下表所示:
子功能项 | 功能描述 |
语音算法服务 | 包含噪音过滤阈值、文字合成语音的语速、音量和语调设置等功能,支持使用系统内置或自定义语音算法服务。 |
静音检测 | 也称VAD阈值,用以对用户侧语音进行断句判定,一般设置为600~800毫秒之间,上限为2000毫秒,过长会导致对话响应变慢。 |
语气承接能力 | 语气承接(Beta版) 允许机器人在回答内容前播放多样的、口语化的语气承接内容,可降低延迟体验、增加对话自然度。 |
优雅打断 | 优雅打断是智能外呼独有的“音义一体”体系的能力之一。基于对比学习、融合语音和语义特征,实现了语义打断、噪音过滤、背景人声过滤等多种能力,可以有效改善机器人被误打断的情况。 |
智能断句 | 智能断句模型融合了人类说话行为的特征、每句话的语音和语义特征,来更准确判断用户表达是否完整、是否只是句中停顿,从而避免错误断句导致的对话错乱。 |
情绪识别 | 整合了语音、语义特征的情绪识别能力,可以更准确的判断用户侧多样的情绪,以便对不同情绪结果进行个性化回应。相比纯文本的情绪识别,会有更好的准确率。 |
用户打断 | 指机器人在播放时用户是否可以打断。对场景中所有对话流生效。 |
挂机配置 | 配置机器人可以实现自主挂机,在外呼任务进行中时若遇到对方为语音助手、分机号转接情况时实现自主挂机。 |
功能入口
根据实际业务需求,进入有关业务空间后,选择“场景管理”,进入有关场景;
进入有关场景后,选择“语音&VUI”标签,即可进入有关功能设计界面。
内容配置
语音算法服务
有关语音算法服务内容配置项的含义及系统界面如下图所示:
其它子功能
有关语音&VUI其它子功能内容配置项的含义及系统界面如下图所示:
开启静音检测 | 用以对用户侧语音进行断句判定,一般设置为600-800毫秒之间,过长会导致对话响应变慢。 |
语气承接能力 | 语气承接(Beta版)允许机器人在回答内容前播放多样的、口语化的语气承接内容,可降低延迟体验、增加对话自然度。 |
承接语管理 | 列表中的承接语将会根据算法模型决策结果进行播放,您可以根据延迟、TTS等效果进行调整。 |
开启优雅打断功能 | 开启后可以有效改善机器人被误打断的情况。 |
开启智能断句能力 | 开启后,可以判断用户表达的是否完整、是否句中停顿,有效解决对话混乱。 |
开启情绪识别能力 | 开启后,在场景对话流的变量中,可以得到情绪分类标签、情绪意图和对应等级。 |
开启用户打断能力 | 开启后机器人在播放时用户可以进行打断。对场景中所有对话流生效。 |
特殊情况拦截 | 开启后,可以多选场景,在接通后触发以下情况时【语音助手、分机号转接】,执行挂机。 |