通信智能引擎快速入门

智能联络中心提供通信智能引擎,通过对接大语言模型,封装通话过程,实现通话事件感知和控制。本文为您介绍如何快速上手通信智能引擎。

通信智能引擎通过集成ASR(语音识别)和TTS(文本转语音),以文本流推拉的方式进行和大模型的交互,并对通话过程的打断、静音、抢话等事件进行感知和控制,形成整体拟人化的交互效果。智能联络中心同时提供其他功能模块可供您选择:

  • 如果您希望开箱即用:您可以选择语音智能体,内置阿里云通信大模型,无需配置大模型即可快速接入。

  • 如果您希望通过画布进行编排:您可以选择智能联络机器人,不接入大模型,但需提前设计呼叫话术。

接入流程

本文将指引您完成大模型配置,并接入智能通信引擎、创建大模型应用,整体流程:

image

当完成接入并拨通用户后,通信智能引擎首先将向用户播放开场白,在接收到用户回复后将内容传给大模型并根据大模型处理进行放音。在此过程中,通信智能引擎还可以处理打断、静默等通话事件,如下图所示。

image

准备工作

  1. 阿里云账号注册及实名认证:使用智能联络中心需完成企业实名认证,暂不支持个人用户使用。

  2. 开通智能联络中心服务:请访问智能联络中心控制台开通服务。

  3. 开通阿里云百炼服务(可选):如果您选择接入阿里云百炼模型,请登录阿里云百炼控制台开通服务。

号码申请

在接入通信智能引擎前,您还需要完成语音资质、号码资源等申请工作。语音号码的资质申请、资源申请以及后续的账单查看均需要在语音服务中完成。

  1. 申请语音资质:请访问语音服务控制台,在导航栏中选择资质话术管理 > 资质管理,单击添加新资质,根据资质材料要求,填写相关信息并发起申请。

  2. 申请语音话术:请等待资质审核通过后,在导航栏中选择资质话术管理 > 场景&话术管理,单击新增话术,根据提示填写信息和话术。业务模式请选择专属模式。

  3. 申请号码资源:请等待话术审核通过后,在导航栏中选择语音号码 > 真实号申请,单击申请号码,根据业务需要申请相关归属地的固定号码和手机号码。

    说明

    单个普通号码月租费35元/月,号码开通当月开始扣费,不满一个月按一个月扣费。您也可以联系您的商务经理进行全托管:全托管是语音服务产品提供的功能,平台根据客户业务呼叫情况自动化的申请号码、更换号码,保障客户接通率。

配置大模型

使用通信智能引擎前,您需要自己自行配置大模型,推荐您通过阿里云百炼使用通义千问系列模型,或者使用开源模型以及市场上的商业化成熟模型。

  • 若您使用自有大模型,或接入第三方大模型,需符合通信引擎网关标准协议才可以接入。

  • 若您选择使用阿里云百炼,您可以通过模型对接或通过应用对接。

    • 通过模型对接:您可以查阅模型列表,选择您需要使用的大语言模型,后续创建大模型网关时需要使用。

    • 通过应用对接:大语言模型无法直接回答私有知识领域的问题,您可以借助阿里云百炼的智能体应用构建能力和私有知识文档,构建一个能回答私有领域问题的大模型问答应用。大模型应用要应用于呼叫只能使用流式输出,否则机器人讲话内容生成过慢导致交互不流畅,目前推荐使用智能体应用对话型工作流应用

      智能体应用

      1. 登录阿里云百炼,访问应用管理页面。单击新增应用

        image

      2. 选择智能体应用,单击立即创建

        image

      3. 选择需要使用的百炼模型,输入指令、知识库等,具体操作步骤请参见0代码构建问答应用。完成后单击发布。

        image

      4. 返回应用管理页面,获取应用ID。

        image

      5. https://dashscope.aliyuncs.com/api/v1/apps/YOUR_APP_ID/completion中的YOUR_APP_ID替换为上面得到的应用ID,即可得到模型地址。

      对话型工作流应用

      1. 登录阿里云百炼,访问应用管理页面。单击新增应用

        image

      2. 选择工作流应用,单击创建对话型工作流

        image

      3. 根据实际需要完成节点配置,具体操作请参见对话型工作流。配置完成后单击发布

        说明
        • 请确保对应大模型的输出节点开启“结果返回”,否则只能支持模型所有回答完成后的输出。

        • 请确保工作流结束节点为文本输出方式,并且关闭“结果返回”开关,否则会产生重复内容。

        • 对话型工作流应用支持传入自定义参数。

        image

      4. 返回应用管理页面,获取应用ID。

        image

      5. https://dashscope.aliyuncs.com/api/v1/apps/YOUR_APP_ID/completion中的YOUR_APP_ID替换为上面得到的应用ID,即可得到模型地址。

步骤一:创建并上线大模型网关

创建大模型网关

  1. 请访问智能联络中心控制台,在导航栏中选择大模型通信 > 通信智能引擎 > 大模型网关配置,单击创建大模型网关

    image

  2. 在弹窗中填写模型相关信息。以阿里云百炼为例:

    说明

    您可以使用通义千问系列模型,或者使用开源模型以及市场上的商业化成熟模型。若需要自建大模型,请完成业务场景的微调和提示词配置,然后再对接通信智能引擎。您的自有大模型只有符合大模型网关对接参数协议才可以接入。

    配置项

    描述

    最佳实践配置

    模型名称

    请输入自定义名称,用于区分您创建的大模型网关。

    测试网关

    模型地址

    请输入大模型调用地址。

    • 若接入阿里云百炼模型:https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions

    • 若接入阿里云百炼应用:将https://dashscope.aliyuncs.com/api/v1/apps/YOUR_APP_ID/completion中的YOUR_APP_ID替换为您创建的应用ID

    http://****

    授权码

    大模型服务API Key。若您使用阿里云百炼,请访问阿里云百炼控制台获取API Key;若无可用API Key,请单击右上角的创建我的API_KEY

    s*********************************1

    模型temperature

    采样温度,控制模型生成文本的多样性。

    0.7

    说明

    此配置参数为推荐值。

    模型topP

    核采样的概率阈值,控制模型生成文本的多样性。

    0.9

    说明

    此配置参数为推荐值。

    模型topK

    生成过程中采样候选集的大小。

    50

    说明

    此配置参数为推荐值。

    基模板本

    模型版本,作为参数传递给大模型。如通义的模型版本分为qwen-plus、qwen-turbo、qwen-max。更多请参见模型列表

    qwen-plus

测试上线大模型网关

模型网关创建后需要通过测试才可以上线使用,以供后续被大模型应用关联。

  1. 请访问智能联络中心控制台,在导航栏中选择通信智能引擎 > 大模型网关配置,选择您所创建的大模型并单击操作列中的测试

    image.png

  2. 在弹出的对话框中输入测试内容,单击测试查看测试结果和内容。

    image.png

  3. 测试通过后,单击操作列中的上线

步骤二:创建并配置大模型应用

创建大模型应用

  1. 请访问智能联络中心控制台,在导航栏中选择大模型通信>通信智能引擎>大模型应用管理,单击创建大模型应用

    image

    配置项

    描述

    示例

    应用名称

    请输入自定义名称。

    测试应用

    模型名称

    选择已上线的大模型网关。

    -

    基模板本

    选择基模板本。

    -

    最大并发

    默认为10,如需调整请联系运营。

    -

    资质

    选择已审核通过的资质,请在语音服务资质管理中查看资质信息。

    -

    话术

    选择已审核通过的话术,请在语音服务话术管理中查看话术信息。

    -

    开场白

    请自定义开场白内容,支持使用变量格式为${param}。

    您好,请问您是${param}吗?

    Prompt

    请自定义Prompt内容,支持使用变量格式为${param}。

    您好,请问您是${param}吗?

    呼叫音色

    您可选择预置音色或个性化音色,并支持声音风格、语速、音量调节。您可以输入文本内容后在线试听。

    -

  2. 单击提交,完成应用添加。

配置大模型应用属性

说明
  • 若您对大模型音色有个性化要求,您可自行上传音频文件,大模型将根据音色特质学习出个性化音色。具体操作请参见个性化音色

  • 若您需要对大模型添加热词库,您可自行创建热词库。具体操作请参见语音转文本热词库

  1. 选择您所创建的大模型应用并单击操作列中的对话属性配置

    image.png

  2. 在弹窗中完成参数设置:

    1. 静默时长:当通话双方都不说话时的等待时长,超出该时长后将触发静默模型。参数范围为3~15秒,建议配置为5秒。

    2. 静默触发模型

      • 是:开启静默触发模型,当通话双方都没有说话的时候会主动触发模型生成内容,并把静默事件推送给大模型。

      • 否:不开启静默触发模型。

    3. 静默挂断配置:设置静默事件发生次数,当达到该次数后将触发主动挂断来结束通话。参数范围为1~5次,建议配置为3次。

    4. 智能接听识别:开启后将自动识别语音助手/信箱并中断通话,提升呼叫效率。

    5. 最大通话时长(非必填):超出时长将自动挂断,参数范围300~3600秒。

  3. 单击确定,完成配置。

步骤三:配置回执消息(可选)

  1. 访问智能联络中心控制台,在导航栏中选择大模型通信 > 通信智能引擎 > 回执消息配置

  2. 回执消息配置页签中,找到您需要配置的消息类型,开启相应开关后完成配置。

    消息队列消费模式

    1. 开启通用队列右侧的开关。

      image.png

    2. 配置完成后,即可通过队列名称拉取队列消息,拉取消息的Demo可参见轻量消息队列(原MNS)消费模式

    HTTP批量推送模式

    1. 开启消息接收地址右侧的开关。

      image.png

    2. 在输入框中填写您接收回执消息的地址,系统将通过HTTP请求将消息发送至该地址,请确认返回HTTP状态码为200。

      image.png

步骤四:发起呼叫

配置完成后,您只需通过调用LlmSmartCall接口即可发起呼叫。该接口调用会产生费用,如果余额不足可能会导致本次调用失败。

您可通过OpenAPI门户在线调试发起呼叫,输入参数如下:

  • CalledNumber:被叫号码,即需要接听来电的用户号码。

  • ApplicationCode:大模型应用编码,可通过智能联络中心控制台大模型应用管理页面查看。

  • CallerNumber:主叫号码,即您申请的号码,可通过语音服务控制台真实号页面查看。

  • StartWordParam:非必填,如果您在创建大模型应用时设置的开场白包含变量,请通过此字段传入变量内容。

常见问题

相关文档