功能概述
语音&VUI功能由若干项子功能组成,有关子功能介绍如下表所示:
子功能项 | 功能描述 |
语音算法服务 | 包含噪音过滤阈值、文字合成语音的语速、音量和语调设置等功能,支持使用系统内置或自定义语音算法服务。 |
静音检测 | 也称VAD阈值,用以对用户侧语音进行断句判定,一般设置为600~800毫秒之间,上限为2000毫秒,过长会导致对话响应变慢。 |
语气承接能力 | 语气承接(Beta版) 允许机器人在回答内容前播放多样的、口语化的语气承接内容,可降低延迟体验、增加对话自然度。 |
优雅打断 | 优雅打断是智能外呼独有的“音义一体”体系的能力之一。基于对比学习、融合语音和语义特征,实现了语义打断、噪音过滤、背景人声过滤等多种能力,可以有效改善机器人被误打断的情况。 |
智能断句 | 智能断句模型融合了人类说话行为的特征、每句话的语音和语义特征,来更准确地判断用户表达是否完整、是否只是句中停顿,从而避免错误断句导致的对话错乱。 |
情绪识别 | 整合了语音、语义特征的情绪识别能力,可以更准确地判断用户者多样的情绪,以便对不同情绪结果进行个性化回应。相比纯文本的情绪识别,会有更好的准确率。 |
用户打断 | 指机器人在播放时用户是否可以打断。对场景中所有对话流生效。 |
挂机配置 | 配置机器人可以实现自主挂机,在外呼任务进行中若遇到对方为语音助手、分机号转接情况时实现自主挂机。 |
功能入口
根据实际业务需求,进入有关业务空间后,选择“场景管理”,进入有关场景;
进入有关场景后,选择“语音&VUI”标签,即可进入有关功能设计界面。
内容配置
语音算法服务
语音合成服务
默认服务:
有关语音算法服务内容配置项的含义及系统界面如下图所示:
TTS音色模板:可以选择已有的音色模板,具体可点击查看音色。
语速、音量、语调可以进行自定义设置。
同时支持点击内容试听。
自定义服务
目前支持阿里、第三方的语音合成服务。
注意:对接自有的语音算法服务,使用自定义的模型、热词等配置。但ASR、TTS服务会单独收费,智能外呼不再包含此费用。
在使用阿里云语音服务能力时支持绑定该账号在阿里云语音服务中配置的项目以及声音调用ID。
使用第三方的语音合成前提是需要在系统管理中配置第三方语音鉴权信息,同时由于开发能力的限制,会导致语音标注、变量、读法、停顿功能不可用。
语音识别服务
默认服务:
配置项的含义及系统界面如下图所示:
ASR模型:支持中文以及英文等多语种场景。
ASR热词:可在语音数据集中上传热词集后进行选择。
噪音过滤阈值:取值越趋于-1,噪音被判定为语音的概率越大;取值越趋于+1,语音被判定为噪音的概率越大。该参数属高级参数,调整需慎重并重点测试。
自定义服务
目前支持阿里、第三方的语音合成服务。
注意:对接自有的语音算法服务,使用自定义的模型、热词等配置。但ASR、TTS服务会单独收费,智能外呼不再包含此费用。
在使用阿里云语音服务能力时支持绑定该账号在阿里云语音服务中配置的项目。
使用第三方的语音合成前提是需要在系统管理中配置第三方语音鉴权信息,同时由于开发能力的限制,会导致语音标注、变量、读法、停顿功能不可用。
其它子功能
有关语音&VUI其它子功能内容配置项的含义及系统界面如下图所示:
开启静音检测 | 用以对用户的语音进行断句判定,一般设置为600-800毫秒之间,过长会导致对话响应变慢。 |
语气承接能力 | 语气承接(Beta版)允许机器人在回答内容前播放多样的、口语化的语气承接内容,可降低延迟体验、增加对话自然度。 |
承接语管理 | 列表中的承接语将会根据算法模型决策结果进行播放,您可以根据延迟、TTS等效果进行调整。 |
开启优雅打断功能 | 开启后可以有效改善机器人被误打断的情况。 |
开启智能断句能力 | 开启后,可以判断用户表达的是否完整、句中是否停顿,有效解决对话混乱。 |
开启情绪识别能力 | 开启后,在场景对话流的变量中,可以得到情绪分类标签、情绪意图和对应等级。 |
开启用户打断能力 | 开启后机器人在播放时用户可以进行打断。对场景中所有对话流生效。 |
特殊情况拦截 | 开启后,可以多选场景,在接通后触发以下情况时【语音助手、分机号转接】,执行挂机。 |
- 本页导读 (1)
- 功能概述
- 功能入口
- 内容配置
- 语音算法服务
- 其它子功能