在大模型外呼中,配置语音与VUI的流程。
1.语音配置
可根据需求选择调用系统内置默认服务或者自定义服务。
默认服务
ASR热词:如果您的业务领域有部分词汇默认识别效果不够好,可以考虑使用热词功能,将这些词添加到词表从而改善识别结果,详细步骤可参考文档语音数据集。
噪音过滤阈值:取值越趋于-1,噪音被判定为语音的概率越大;取值越趋于+1,语音被判定为噪音的概率越大。该参数属高级参数,调整需慎重并重点测试。
TTS音色模板:可以根据自己需求选择音色模板,可以参考接口说明参考具体音色。
注意:平台新增大模型音色能力,效果更拟人,如有业务需求请联系运营人员添加白名单支持。
语速、音量、语调:根据实际业务场景可以修改音色的语速、音量、语调。
内容试听:当语音参数配置完成后,可以自定义输入一些文字进行效果测试。
自定义服务
注意:对接自有的语音算法服务,使用自定义的模型、热词等配置。但ASR、TTS服务会单独收费,智能外呼不再包含此费用。
目前自定义服务支持阿里与科大讯飞的语音服务。
阿里语音服务
支持绑定该账号在阿里云语音服务中配置的项目ID。
前置条件:可以登录语音交互控制台,进行配置语音项目。
项目名称:配置完成后,可以选择已有的语音服务项目:
声音调用ID:仅在使用语音交互产品的“个性化人声定制”时填写;其他情况无需填写,默认使用项目中绑定的语音识别与合成能力。
内容试听:当语音参数配置完成后,可以自定义输入一些文字进行效果测试。
科大讯飞语音服务
支持绑定科大开放平台中的实时语音服务,请先在【系统管理】中配置鉴权信息。由于开放能力限制,会导致语音标注、变量、读法、停顿功能不可用。
进入系统管理-第三方语音配置中填入APPID、APISecret、APIkey值,完成配置。
在系统管理中第三方语音配置完成后,返回语音&VUI界面中查看,对噪音过滤阈值、TTS音色模板、语速、音量、语调进行配置。
2.智能VUI配置
支持静音检测配置
自定义超时时间判断为静音,时间范围在300-10000毫秒。默认700毫秒
支持静默回复配置
静默回复:自定义超时时间播报静音话术,时间范围300-10000毫秒,默认5000毫秒。
静默挂机:点击开启后,可自定义话术播报数量执行挂机,数量范围在1-10轮,默认为2。
打断配置
选择开启或关闭用户打断配置,默认关闭。
支持智能挂机判断。
AI智能挂机:选择开启或关闭当用户表达挂机意向或机器人任务执行完成时,执行挂机。
最多交互轮次判断:当用户与机器人交互达到设定轮次时,播报挂机话术并执行挂机。
选择开启或关闭最多交互轮次判断。
自定义设置最多交互轮次,数量范围1-100,默认为20。
自定义设置挂机播报话术。
特殊情况拦截:接通后触发以下情况时,执行挂机。
可以选择开启或关闭,默认为关闭。
开启后可以选择多选项【语音助手、分机号转接】
当由语音助手/来电秘书等机器人接起时,执行挂机。
当被叫表单中不包含分机号,接通后提示输入分机号时,执行挂机。
延迟挂机:自定义设置话术播放完后的时间执行挂机动作,默认0秒。
安全拦截配置
拦截播放话术:当生成回复被安全拦截时,播报此话术。