语音&VUI

功能概述

语音&VUI功能由若干项子功能组成,有关子功能介绍如下表所示:

子功能项

功能描述

语音算法服务

包含噪音过滤阈值、文字合成语音的语速、音量和语调设置等功能,支持使用系统内置或自定义语音算法服务。

静音检测

也称VAD阈值,用以对用户侧语音进行断句判定,一般设置为600~800毫秒之间,上限为2000毫秒,过长会导致对话响应变慢。

语气承接能力

语气承接(Beta版) 允许机器人在回答内容前播放多样的、口语化的语气承接内容,可降低延迟体验、增加对话自然度。

优雅打断

优雅打断是智能外呼独有的“音义一体”体系的能力之一。基于对比学习、融合语音和语义特征,实现了语义打断、噪音过滤、背景人声过滤等多种能力,可以有效改善机器人被误打断的情况。

智能断句

智能断句模型融合了人类说话行为的特征、每句话的语音和语义特征,来更准确判断用户表达是否完整、是否只是句中停顿,从而避免错误断句导致的对话错乱。

情绪识别

整合了语音、语义特征的情绪识别能力,可以更准确的判断用户侧多样的情绪,以便对不同情绪结果进行个性化回应。相比纯文本的情绪识别,会有更好的准确率。

用户打断

指机器人在播放时用户是否可以打断。对场景中所有对话流生效。

挂机配置

配置机器人可以实现自主挂机,在外呼任务进行中时若遇到对方为语音助手、分机号转接情况时实现自主挂机。

功能入口

  1. 根据实际业务需求,进入有关业务空间后,选择“场景管理”,进入有关场景;

image

image

  1. 进入有关场景后,选择“语音&VUI”标签,即可进入有关功能设计界面。

image

内容配置

语音算法服务

有关语音算法服务内容配置项的含义及系统界面如下图所示:

image

其它子功能

有关语音&VUI其它子功能内容配置项的含义及系统界面如下图所示:image

开启静音检测

用以对用户侧语音进行断句判定,一般设置为600-800毫秒之间,过长会导致对话响应变慢。

语气承接能力

语气承接(Beta版)允许机器人在回答内容前播放多样的、口语化的语气承接内容,可降低延迟体验、增加对话自然度。

承接语管理

列表中的承接语将会根据算法模型决策结果进行播放,您可以根据延迟、TTS等效果进行调整。

开启优雅打断功能

开启后可以有效改善机器人被误打断的情况。

开启智能断句能力

开启后,可以判断用户表达的是否完整、是否句中停顿,有效解决对话混乱。

开启情绪识别能力

开启后,在场景对话流的变量中,可以得到情绪分类标签、情绪意图和对应等级。

开启用户打断能力

开启后机器人在播放时用户可以进行打断。对场景中所有对话流生效。

特殊情况拦截

开启后,可以多选场景,在接通后触发以下情况时【语音助手、分机号转接】,执行挂机。

image