首页 语音服务 API参考 API目录 智能语音交互呼出 SmartCall - 发起智能语音交互通话

SmartCall - 发起智能语音交互通话

发起智能语音交互通话。

接口说明

  • SmartCall需要与智能外呼回调HTTP接口联合使用,语音平台发起呼叫后会把转换后的语音文本回传给业务方,业务方把下一步的执行动作返回给语音平台。
  • 以下字符不可以在智能语音交互SmartCall回调中出现:@ = : "" $ { } ^ * ¥

QPS限制

单用户调用频率:1000次/秒。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

调试

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。
  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:
    • 对于必选的资源类型,用背景高亮的方式表示。
    • 对于不支持资源级授权的操作,用全部资源表示。
  • 条件关键字:是指云产品自身定义的条件关键字。
  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作访问级别资源类型条件关键字关联操作
dyvms:SmartCallWrite
  • VoiceMessagingService
    acs:dyvms:*:{#accountId}:*

请求参数

名称类型必填描述示例值
CalledShowNumberstring

被叫显号。必须是已购买的号码。

您可以登录语音服务控制台,选择申请服务>号码管理查看已购买的号码。

0571****5678
CalledNumberstring

被叫号码。仅支持中国内地号码。

1590****0000
VoiceCodestring

智能外呼放音文件。

支持网络文件、控制台上传的语音文件和TTS三种方式。其中,支持使用多个文件和TTS参数混播,之间用英文逗号(,)分隔。TTS参数的替换值在VoiceCodeParam中指定。

  • 当放音文件为网络文件时:参数VoiceCode指定为可被公网访问的语音文件URL。
  • 当放音文件为控制台上传的语音文件时:参数VoiceCode指定为文件的语音ID。您可以登录语音服务控制台,选择语音文件管理>智能语音交互放音文件,单击详情按钮,查看对应的语音ID。
  • 当放音文件为TTS时:参数VoiceCode指定为变量名称如$name$,需要在VoiceCodeParam中设置变量对应的内容。
2d4c-4e78-8d2a-afbb06cf****.wav,$name$
RecordFlagboolean

通话过程中是否录音。取值:

  • true:录音。
  • false:不录音。
true
Volumeinteger

播放用户音频的音量。取值范围:-4~4,建议设置为1

1
Speedinteger

参数暂不支持使用。

1
AsrModelIdstring

ASR模型ID。

您可以登录语音服务控制台,在ASR语言模型管理中查看ASR模型ID。

说明调用SmartCall接口时需要指定使用的ASR模型,建议参数AsrModelId和AsrBaseId二者选填其一。
  • 如果仅设置AsrModelId,表示使用指定的ASR模型。
  • 如果仅设置AsrBaseId,表示使用指定的ASR基础模型。
  • 如果二者均未设置,则使用默认的ASR基础模型,即参数AsrBaseId默认为customer_service_8k,表示使用ASR普通话基础模型。
  • 如果二者同时设置,请确认二者是正确对应的。
  • 2070aca1eff146f9a7bc826f1c3d****
    PauseTimeinteger

    停顿时长。用于设置用户停顿多久表示一句话结束。单位:毫秒,取值范围:300~1200

    说明
  • 如果指定值不在参数范围中,则该参数默认取值为800
  • 该参数首次设置有效,后续设置无效。
  • 800
    MuteTimeinteger

    静音时长。用于设置用户多久不说话通话结束。单位:毫秒,取值范围:1000~20000

    说明
  • 如果指定值不在参数范围中,则该参数默认取值为10000
  • 通话过程中可动态设置,以最后一次设置为准。
  • 10000
    ActionCodeBreakboolean

    当前返回的媒体文件是否可以被打断。默认取值为true,即可被打断。

    如果为false,即使下一个动作action_break为true,也无法打断当前放音。

    说明action_code_break优先级高于action_break。
    true
    OutIdstring

    预留给调用方使用的ID。 最终会通过在回执消息中将此ID带回给调用方。

    字符串类型,长度为1~15个字节。

    342268*****
    DynamicIdstring

    预留给调用方使用的动态扩展ID。在回调地址中带回,用于客户的开发标识。

    abcdefgh
    EarlyMediaAsrboolean

    早媒体语音识别标识。取值:

    • false(默认):关闭。
    • true:开启。
    说明设为true会记录通话未接听的原因。
    true
    VoiceCodeParamstring

    TTS参数传递字符串,格式为JSON。必须与VoiceCode的TTS参数对应。

    {"name":"喂,你好"}
    SessionTimeoutinteger

    最大通话时长,超时后自动挂断。单位:秒。

    说明通话时长最长3600秒。
    120
    ActionCodeTimeBreakinteger

    基于用户持续说话时长打断。单位:毫秒。

    如果当前媒体文件ActionCodeBreak为true,用户持续说话可以打断当前播放。不设置或者为0,不生效。

    120
    TtsStylestring

    TTS变量播放时的声音风格。默认为xiaoyun。具体风格,请参见下表声音风格列表

    xiaoyun
    TtsVolumeinteger

    TTS变量播放的音量。取值范围:0~100,默认值为0

    10
    TtsSpeedinteger

    TTS变量播放时的声音速度。取值范围:-200~200,默认值为0

    100
    TtsConfboolean

    是否设置TTS声音参数。取值:

    • true:设置。需要通过TtsStyleTtsColumeTtsSpeed三个参数来设置声音风格。
    • false:不设置。不需要设置相关参数,即便设置了也不生效。
    true
    AsrBaseIdstring

    ASR基础模型。取值:

    • customer_service_8k(默认):普通话。
    • dialect_customer_service_8k:重口音。
    说明调用SmartCall接口时需要指定使用的ASR模型,建议参数AsrModelId和AsrBaseId二者选填其一。
  • 如果仅设置AsrModelId,表示使用指定的ASR模型。
  • 如果仅设置AsrBaseId,表示使用指定的ASR基础模型。
  • 如果二者均未设置,则使用默认的ASR基础模型,即参数AsrBaseId默认为customer_service_8k,表示使用ASR普通话基础模型。
  • 如果二者同时设置,请确认二者是正确对应的。
  • customer_service_8k
    StreamAsrinteger

    流式ASR,根据用户说的前几个字智能判断语义。取值:

    • 0:关闭。
    • 1:开启。
    1
    BackgroundFileCodestring

    用户和机器人对话时播放的背景语音文件ID。

    您可以登录语音服务控制台,选择语音文件管理>智能语音交互放音文件,单击详情按钮,查看对应的语音ID。

    2d4c-4e78-8d2a-afbb06cf****.wav
    BackgroundVolumeinteger

    参数暂不支持使用。

    1
    BackgroundSpeedinteger

    参数暂不支持使用。

    1
    EnableITNboolean

    是否在后处理中执行ITN。默认为false,即不执行。

    设置为true时,中文数字将转为阿拉伯数字输出。

    false

    声音风格列表

    说明编码
    小云标准女声xiaoyun
    小刚标准男声xiaogang
    若兮温柔女声ruoxi
    小梦标准女声xiaomeng
    小威标准男声xiaowei
    阿美甜美女声amei
    小雪温柔女声xiaoxue
    思琪温柔女声siqi
    思佳标准女声sijia
    思诚标准男声sicheng
    思悦温柔女声siyue
    小美甜美女声xiaomei
    思彤标准童声sitong
    宁儿标准女声ninger
    小北萝莉女声xiaobei
    伊娜浙普女声yina

    返回参数

    名称类型描述示例值
    object

    返回数据。

    Codestring

    请求状态码。

    • 返回OK代表请求成功。
    • 其他错误码,请参见API错误码
    OK
    Messagestring

    状态码的描述。

    OK
    RequestIdstring

    请求ID。

    A90E4451-FED7-49D2-87C8-00700A8C4D0D
    CallIdstring

    此次通话的唯一回执ID。

    CallId可以通过QueryCallDetailByCallId接口查询呼叫详情。

    116012854210^10281427****

    示例

    正常返回示例

    JSON格式

    {
      "Code": "OK",
      "Message": "OK",
      "RequestId": "A90E4451-FED7-49D2-87C8-00700A8C4D0D",
      "CallId": "116012854210^10281427****"
    }

    错误码

    访问错误中心查看更多错误码。

    阿里云首页 语音服务 相关技术圈