启动通话及个性参数配置

更新时间:
复制为 MD 格式

通过阅读本文,您可以了解如何通过传入通话参数来启动智能体通话使本次通话更加符合您的业务场景。

功能描述

智能体在启动通话时,支持传入多个参数,以控制其运行状态及对话响应结果等。您可以根据自身的业务需求,通过传入特定参数,构建适合您业务的智能体对话。更多业务实现,请参见AI面试口语陪练情感陪伴

目前智能体支持两种启动方式,您可以通过选择不同的启动方式,来适配您的业务场景:

  • 通过服务端启动:灵活性强、扩展性强、一致性。

  • 通过客户端启动:接通延时低、轻依赖、独立性强。

说明

您通过控制台配置的问候语、音色、语种等参数,都会在启动智能体时进行覆盖。也可以在通话中调用UpdateAIAgentInstance - 更新AI智能体实例配置接口修改配置。

服务端启动智能体

您可以通过调用生成AI智能体通话实例接口来发起通话,将发起后的结果下发给客户端,客户端再通过返回的信息进入通话。在启动通话时,您可以通过配置AIAgentConfig参数发起通话。发起通话详细流程,请参见如何通过服务端接口发起智能体通话

客户端启动智能体

客户端启动您需要在创建并初始化引擎后,对ARTCAICallConfig中的ARTCAICallAgentConfig进行配置。各客户端启动流程,请参见Android集成概览iOS集成概览Web集成概览Harmony集成概览

Android

ARTCAICallAgentConfig

通话可配置的参数项

参数

类型

含义

agentGreeting

String

智能体欢迎语,为空表示使用智能体配置值,最大长度100字符

wakeUpQuery

String

用户在通话启动前的指令,用于智能体在通话启动后立即响应

agentMaxIdleTime

int

智能体闲时的最大等待时间(单位:秒),超时智能体自动下线,默认值为600s

userOnlineTimeout

int

用户未入会,智能体超时关闭任务的时间,默认值为60s

userOfflineTimeout

int

用户退会后,智能体超时关闭任务的时间,默认值为5s

enablePushToTalk

boolean

是否开启对讲机模式

agentGracefulShutdown

boolean

是否优雅下线:播报完当前句子再停止

volume

int

智能体说话的音量,范围为 0~400,默认值为100

workflowOverrideParams

String

工作流覆盖参数

enableIntelligentSegment

boolean

智能断句开关

asrConfig

ARTCAICallAgentAsrConfig

语音识别配置

ttsConfig

ARTCAICallAgentTtsConfig

语音合成配置

llmConfig

ARTCAICallAgentLlmConfig

大语言模型配置

avatarConfig

ARTCAICallAgentAvatarConfig

数字人配置

interruptConfig

ARTCAICallAgentInterruptConfig

打断配置

voiceprintConfig

ARTCAICallAgentVoiceprintConfig

声纹降噪配置

turnDetectionConfig

ARTCAICallAgentTurnDetectionConfig

轮次检测配置

experimentalConfig

ARTCAICallExperimentalConfig

非产品化定制化配置

ARTCAICallAgentVcrConfig

ARTCAICallAgentVcrConfig

VCR配置

preConnectAudioUrl

String

接通后,播放欢迎语前的音效,支持url传入;播放完音效之后,欢迎语还是会播放

ambientConfig

ARTCAICallAgentAmbientConfig

环境音配置

backChannelingConfig

List<ARTCAICallAgentBackChanneling>

附和语功能配置模块。配置后,系统会在特定触发时机随机播报简短的附和语

autoSpeechForLlmPendingConfig

ARTCAICallAgentAutoSpeechLlmPending

智能体在LLM 响应延迟时的播报自动讲话的配置

autoSpeechForUserIdleConfig

ARTCAICallAgentAutoSpeechUserIdle

智能体在用户静默时问询的配置

iOS

ARTCAICallAgentConfig

通话智能体启动与运行配置

属性名

类型

描述

agentGreeting

String?

智能体欢迎语,为空表示使用智能体配置值

wakeUpQuery

String?

用户在通话启动前的指令,用于智能体在通话启动后立即响应

agentMaxIdleTime

Int32

智能体闲时的最大等待时间(单位:秒),超时智能体自动下线,默认值为600s

userOnlineTimeout

Int32

用户未入会,智能体超时关闭任务的时间,默认值为60s

userOfflineTimeout

Int32

用户退会后,智能体超时关闭任务的时间,默认值为5s

enablePushToTalk

Bool

是否开启对讲机模式

agentGracefulShutdown

Bool

是否优雅下线

volume

Int32

智能体说话的音量,范围为 0~400,默认值为100

workflowOverrideParams

[String: Any]?

工作流覆盖参数

enableIntelligentSegment

Bool

智能断句开关

asrConfig

ARTCAICallAgentAsrConfig

语音识别配置

ttsConfig

ARTCAICallAgentTtsConfig

语音合成配置

llmConfig

ARTCAICallAgentLlmConfig

大语言模型配置

avatarConfig

ARTCAICallAgentAvatarConfig

数字人配置

interruptConfig

ARTCAICallAgentInterruptConfig

打断配置

voiceprintConfig

ARTCAICallAgentVoiceprintConfig

声纹降噪配置

turnDetectionConfig

ARTCAICallAgentTurnDetectionConfig

轮次检测配置

experimentalConfig

ARTCAICallExperimentalConfig

非产品化定制化配置

vcrConfig

ARTCAICallAgentVcrConfig

VCR配置

preConnectAudioUrl

String?

接通后,播放欢迎语前的音效,支持url传入;播放完音效之后,欢迎语还是会播放

ambientConfig

ARTCAICallAgentAmbientConfig

环境配置

backChannelingConfig

ARTCAICallAgentBackChanneling

附和语功能配置模块。配置后,系统会在特定触发时机随机播报简短的附和语

autoSpeechForLlmPendingConfig

ARTCAICallAgentAutoSpeechLlmPending

智能体在LLM 响应延迟时的播报自动讲话的配置

autoSpeechForUserIdleConfig

ARTCAICallAgentAutoSpeechUserIdle

智能体在用户静默时问询的配置

Web

AICallAgentConfig

通话智能体启动与运行配置

属性名

类型

描述

agentGreeting(可选)

string

智能体欢迎语,为空表示使用智能体配置值,最大长度100字符

wakeUpQuery(可选)

string

用户在通话启动前的指令,用于智能体在通话启动后立即响应

agentMaxIdleTime

number

智能体闲时的最大等待时间(单位:秒),超时智能体自动下线,默认值为600s

userOnlineTimeout

number

用户未入会,智能体超时关闭任务的时间,默认值为60s

userOfflineTimeout

number

用户退会后,智能体超时关闭任务的时间,默认值为5s

enablePushToTalk

boolean

是否开启对讲机模式

agentGracefulShutdown

boolean

是否优雅下线:播报完当前句子再停止

volume

number

智能体说话的音量,范围为 0~400,默认值为100

workflowOverrideParams

JSONObject

工作流覆盖参数

enableIntelligentSegment

boolean

智能断句开关

asrConfig

AICallAgentAsrConfig

语音识别配置

ttsConfig

AICallAgentTtsConfig

语音合成配置

llmConfig

AICallAgentLlmConfig

大语言模型配置

avatarConfig

AICallAgentAvatarConfig

数字人配置

interruptConfig

AICallAgentInterruptConfig

打断配置

voiceprintConfig

AICallAgentVoiceprintConfig

声纹降噪配置

turnDetectionConfig

AICallAgentTurnDetectionConfig

轮次检测配置

experimentalConfig

JSONObject

非产品化定制化配置

vcrConfig

AICallAgentVcrConfig

VCR配置

Harmony

ARTCAICallAgentConfig

通话智能体启动与运行配置

属性名

类型

描述

agentGreeting

string

智能体欢迎语,为空表示使用智能体配置值。

wakeUpQuery

string

用户在通话启动前的指令,用于智能体在通话启动后立即响应,例如:"今天天气怎么样?"。

agentMaxIdleTime

number

智能体闲时的最大等待时间(单位:秒),超时智能体自动下线,默认值为600s,-1则关闭自动下线(永远不会自动下线)。

userOnlineTimeout

number

用户未入会,智能体超时关闭任务的时间,默认值为60s,小于0则不会发给服务端(使用服务端默认值60s)。

userOfflineTimeout

number

用户退会后,智能体超时关闭任务的时间,默认值为5s,小于0则不会发给服务端(使用服务端默认值5s)。

enablePushToTalk

boolean

是否开启对讲机模式。

agentGracefulShutdown

boolean

是否优雅下线,优雅下线:当智能体被停止的时候,播报完当前说的话再停止,最多播报 10 秒。

volume

number

智能体说话的音量,范围为 0~400,输出音量=工作流中的语音输出音量 *

volume/100,默认值为100,小于0则不会发给服务端(使用服务端默认值100)。

workflowOverrideParams

Record<string, RecordValueType>

工作流覆盖参数。

enableIntelligentSegment

boolean

智能断句开关,开启智能断句后,用户说话的发生断句会智能合并成一句。

preConnectAudioUrl

string

接通后,播放欢迎语前的音效,支持url传入;播放完音效之后,欢迎语还是会播放。

asrConfig

ARTCAICallAgentAsrConfig

语音识别配置。

ttsConfig

ARTCAICallAgentTtsConfig

语音合成配置。

llmConfig

ARTCAICallAgentLlmConfig

大语言模型配置。

avatarConfig

ARTCAICallAgentAvatarConfig

数字人配置。

interruptConfig

ARTCAICallAgentInterruptConfig

打断配置。

voiceprintConfig

ARTCAICallAgentVoiceprintConfig

声纹降噪配置。

turnDetectionConfig

ARTCAICallAgentTurnDetectionConfig

轮次检测配置。

experimentalConfig

ARTCAICallExperimentalConfig

非产品化定制化配置。

vcrConfig

ARTCAICallAgentVcrConfig

VCR配置。

ambientConfig

ARTCAICallAgentAmbientConfig

环境配置。

backChannelingConfigs

ARTCAICallAgentBackChanneling[]

附和语功能配置模块。配置后,系统会在特定触发时机随机播报简短的附和语。

autoSpeechForLlmPendingConfig

ARTCAICallAgentAutoSpeechLlmPending

智能体在LLM 响应延迟时的播报自动讲话的配置。

autoSpeechForUserIdleConfig

ARTCAICallAgentAutoSpeechUserIdle

智能体在用户静默时问询的配置。