语音&智能VUI

在大模型外呼中,配置语音与VUI的流程。

1.语音配置

可根据需求选择调用系统内置默认服务或者自定义服务。

语音合成服务

默认服务

  • TTS音色模板:可以根据自己需求选择音色模板,可以参考接口说明参考具体音色。

  • 语速、音量、语调:根据实际业务场景可以修改音色的语速、音量、语调。

  • 内容试听:当语音参数配置完成后,可以自定义输入一些文字进行效果测试。

image

自定义服务

注意:对接自有的语音算法服务,使用自定义的模型、热词等配置。但ASR、TTS服务会单独收费,智能外呼不再包含此费用。image

阿里语音服务

支持绑定该账号在阿里云语音服务中配置的项目ID。

  • 前置条件:可以登录语音交互控制台,进行配置语音项目。

    image

  • 项目名称:配置完成后,可以选择已有的语音服务项目:image

  • 声音调用ID:仅在使用语音交互产品的“个性化人声定制”时填写;其他情况无需填写,默认使用项目中绑定的语音识别与合成能力。image

  • 内容试听:当语音参数配置完成后,可以自定义输入一些文字进行效果测试。

第三方语音服务

使用第三方的语音合成前提是需要在系统管理中配置第三方语音鉴权信息,同时由于开发能力的限制,会导致语音标注、变量、读法、停顿功能不可用。

注意:第三方语音服务有不支持大模型场景,请注意区分

image

语音识别

  • 默认服务:

    配置项的含义及系统界面如下图所示:

    • ASR模型:支持中文以及英文等多语种场景。

    • ASR热词:可在语音数据集中上传热词集后进行选择。

    • 噪音过滤阈值:取值越趋于-1,噪音被判定为语音的概率越大;取值越趋于+1,语音被判定为噪音的概率越大。该参数属高级参数,调整需慎重并重点测试。

      image

  • 自定义服务

    • 目前支持阿里合成服务以及第三方的语音合成能力。

      注意:对接自有的语音算法服务,使用自定义的模型、热词等配置。但ASR、TTS服务会单独收费,智能外呼不再包含此费用。

      • 在使用阿里云语音服务能力时支持绑定该账号在阿里云语音服务中配置的项目。image

      • 支持使用第三方语音合成能力,请先在外呼系统管理中配置鉴权信息。由于开放能力限制,会导致语音标注、变量、读法、停顿功能不可用。image

2.智能VUI配置image

  • 支持静音检测配置

    • 自定义超时时间判断为静音,时间范围在300-10000毫秒。默认700毫秒

  • 支持静默回复配置

    • 静默回复:自定义超时时间播报静音话术,时间范围300-10000毫秒,默认5000毫秒。

    • 静默挂机:点击开启后,可自定义话术播报数量执行挂机,数量范围在1-10轮,默认为2。

  • 语音打断配置

    • 选择开启或关闭用户打断配置,默认关闭。

    • 开启打断配置后:

      • 挂机话术播报可打断,延迟挂机期间可打断,指定延迟挂机后不执行挂机,模型继续回复。

      • 按键/语音可打断收号前置的话术播报。

      • 开启打断后截断播报内容,在语音调试、通话详情、导出通话记录中查看打断前的通话内容。

        说明

        此功能默认关闭,如果需要打断后截断播报内容能力,需要联系运营人员进行加白处理。

    • 关闭打断配置后:

      • 挂机话术播报不可打断,指定延迟后执行挂机;延迟期间可打断,不执行挂机,模型继续回复。

      • 按键输入可打断收号前置播报;语音输入无法打断收号前置播报。

  • 承接语模型配置

    • 基于模型逻辑优化,历史已创建的场景默认关闭,新建场景默认开启。开启后,将优化每次对话过程中的机器人的上下文承接语,无需自行配置。

  • 挂机配置。

    • AI智能挂机:选择开启或关闭当用户表达挂机意向或机器人任务执行完成时,执行挂机。

    • 最多交互轮次判断:当用户与机器人交互达到设定轮次时,播报挂机话术并执行挂机。

      • 选择开启或关闭最多交互轮次判断。

      • 自定义设置最多交互轮次,数量范围1-100,默认为20。

    • 自定义设置挂机播报话术。

    • 特殊情况拦截:接通后触发以下情况时,执行挂机。

      • 可以选择开启或关闭,默认为关闭。

      • 开启后可以选择多选项【语音助手、分机号转接】

        • 当由语音助手/来电秘书等机器人接起时,执行挂机。

        • 当被叫表单中不包含分机号,接通后提示输入分机号时,执行挂机。

    • 延迟挂机:自定义设置话术播放完后的时间执行挂机动作,默认0秒。

  • 安全拦截配置

    • 拦截播放话术:当生成回复被安全拦截时,播报此话术。