语音&智能VUI

在大模型外呼中,配置语音与VUI的流程。

1.语音配置

可根据需求选择调用系统内置默认服务或者自定义服务。

默认服务

  • ASR热词:如果您的业务领域有部分词汇默认识别效果不够好,可以考虑使用热词功能,将这些词添加到词表从而改善识别结果,详细步骤可参考文档语音数据集

  • 噪音过滤阈值:取值越趋于-1,噪音被判定为语音的概率越大;取值越趋于+1,语音被判定为噪音的概率越大。该参数属高级参数,调整需慎重并重点测试。

  • TTS音色模板:可以根据自己需求选择音色模板,可以参考接口说明参考具体音色。

    • 注意:平台新增大模型音色能力,效果更拟人,如有业务需求请联系运营人员添加白名单支持。

  • 语速、音量、语调:根据实际业务场景可以修改音色的语速、音量、语调。

  • 内容试听:当语音参数配置完成后,可以自定义输入一些文字进行效果测试。

image

自定义服务

注意:对接自有的语音算法服务,使用自定义的模型、热词等配置。但ASR、TTS服务会单独收费,智能外呼不再包含此费用。

目前自定义服务支持阿里与科大讯飞的语音服务。

image

阿里语音服务

支持绑定该账号在阿里云语音服务中配置的项目ID。

  • 前置条件:可以登录语音交互控制台,进行配置语音项目。

    image

  • 项目名称:配置完成后,可以选择已有的语音服务项目:image

  • 声音调用ID:仅在使用语音交互产品的“个性化人声定制”时填写;其他情况无需填写,默认使用项目中绑定的语音识别与合成能力。image

  • 内容试听:当语音参数配置完成后,可以自定义输入一些文字进行效果测试。

科大讯飞语音服务

支持绑定科大开放平台中的实时语音服务,请先在【系统管理】中配置鉴权信息。由于开放能力限制,会导致语音标注、变量、读法、停顿功能不可用。

进入系统管理-第三方语音配置中填入APPID、APISecret、APIkey值,完成配置。image

在系统管理中第三方语音配置完成后,返回语音&VUI界面中查看,对噪音过滤阈值、TTS音色模板、语速、音量、语调进行配置。image

2.智能VUI配置

  • 支持静音检测配置

    • 自定义超时时间判断为静音,时间范围在300-10000毫秒。默认700毫秒

  • 支持静默回复配置

    • 静默回复:自定义超时时间播报静音话术,时间范围300-10000毫秒,默认5000毫秒。

    • 静默挂机:点击开启后,可自定义话术播报数量执行挂机,数量范围在1-10轮,默认为2。

  • 打断配置

    • 选择开启或关闭用户打断配置,默认关闭。

  • 支持智能挂机判断。

    • AI智能挂机:选择开启或关闭当用户表达挂机意向或机器人任务执行完成时,执行挂机。

    • 最多交互轮次判断:当用户与机器人交互达到设定轮次时,播报挂机话术并执行挂机。

      • 选择开启或关闭最多交互轮次判断。

      • 自定义设置最多交互轮次,数量范围1-100,默认为20。

    • 自定义设置挂机播报话术。

    • 特殊情况拦截:接通后触发以下情况时,执行挂机。

      • 可以选择开启或关闭,默认为关闭。

      • 开启后可以选择多选项【语音助手、分机号转接】

        • 当由语音助手/来电秘书等机器人接起时,执行挂机。

        • 当被叫表单中不包含分机号,接通后提示输入分机号时,执行挂机。

    • 延迟挂机:自定义设置话术播放完后的时间执行挂机动作,默认0秒。

  • 安全拦截配置

    • 拦截播放话术:当生成回复被安全拦截时,播报此话术。

image