文档

语音&VUI

更新时间:

功能概述

语音&VUI功能由若干项子功能组成,有关子功能介绍如下表所示:

子功能项

功能描述

语音算法服务

包含噪音过滤阈值、文字合成语音的语速、音量和语调设置等功能,支持使用系统内置或自定义语音算法服务。

静音检测

也称VAD阈值,用以对用户侧语音进行断句判定,一般设置为600~800毫秒之间,上限为2000毫秒,过长会导致对话响应变慢。

语气承接能力

语气承接(Beta版) 允许机器人在回答内容前播放多样的、口语化的语气承接内容,可降低延迟体验、增加对话自然度。

优雅打断

优雅打断是智能外呼独有的“音义一体”体系的能力之一。基于对比学习、融合语音和语义特征,实现了语义打断、噪音过滤、背景人声过滤等多种能力,可以有效改善机器人被误打断的情况。

智能断句

智能断句模型融合了人类说话行为的特征、每句话的语音和语义特征,来更准确判断用户表达是否完整、是否只是句中停顿,从而避免错误断句导致的对话错乱。

情绪识别

整合了语音、语义特征的情绪识别能力,可以更准确的判断用户侧多样的情绪,以便对不同情绪结果进行个性化回应。相比纯文本的情绪识别,会有更好的准确率。

用户打断

指机器人在播放时用户是否可以打断。对场景中所有对话流生效。

功能入口

  1. 根据实际业务需求,进入有关业务空间后,选择“场景管理”,进入有关场景;

imageimage
  1. 进入有关场景后,选择“语音&VUI”标签,即可进入有关功能设计界面。

image

内容配置

语音算法服务

有关语音算法服务内容配置项的含义及系统界面如下图所示:

image

其它子功能

有关语音&VUI其它子功能内容配置项的含义及系统界面如下图所示:

image
  • 本页导读 (0)
文档反馈