Harmony数据结构

更新时间:
复制为 MD 格式

通过阅读本文,您可以了解Harmony SDK涉及的数据类型。

数据结构概览

结构类型

数据类型

描述

Enum

ARTCAICallAgentType

智能体类型

ARTCAICallAgentState

智能体状态

ARTCAICallNetworkQuality

网络状态

ARTCAICallSpeakingInterruptedReason

智能体当前讲话被打断原因

ARTCAICallConnectionStatus

通话过程的网络连接状态

ARTCAICallAudioProfile

音频编码配置

ARTCAICallAudioScenario

音频场景配置

ARTCAICallAgentViewMode

智能体视图渲染模式

ARTCAICallAgentViewMirrorMode

智能体视图镜像模式

ARTCAICallAgentViewRotationMode

智能体视图旋转模式

ARTCAICallAudioAccompanyState

音乐伴奏播放状态

ARTCAICallAudioAccompanyErrorCode

音乐伴奏播放错误码

ARTCAICallVoiceprintResult

Vad反馈结果

ARTCAICallTurnDetectionMode

判断用户说话是否结束模式

Class

ARTCAICallAgentInfo

智能体运行时信息

ARTCAICallConfig

智能体通话的配置

ARTCAICallAudioConfig

通话本地音频配置

ARTCAICallVideoConfig

通话本地视频配置

ARTCAICallViewConfig

渲染视图配置,当智能体/本地摄像头需要渲染时(例如:数字人)需要通过该类进行设置

ARTCAICallChatSyncConfig

关联的chat智能体会话配置参数

ARTCAICallVisionCustomCaptureRequest

视觉理解智能体开启自定义截帧配置请求Model

ARTCAICallSendTextToAgentRequest

给智能体发送文本消息请求Model

ARTCAICallUserSubtitleResult

用户字幕通知结果

ARTCAICallAgentSubtitleResult

智能体字幕通知结果

ARTCAICallAgentVcrFrameMotionResult

VCR检测结果中的静音帧/无效帧检测结果

ARTCAICallAgentVcrPeopleCountResult

VCR检测结果中的实时画面人数检测结果

ARTCAICallAgentVcrEquipmentResult

VCR检测结果中的电子设备检测结果

ARTCAICallAgentVcrHeadMotionResult

VCR检测结果中的头部动作检测结果

ARTCAICallAgentVcrLookAwayResult

VCR检测结果中的视线偏移检测结果

ARTCAICallAgentVcrResult

VCR检测结果

ARTCAICallAgentShareConfig

分享智能体配置信息

ARTCAICallAgentShareGenerateResult

分享智能体生成结果

ARTCAICallAgentConfig

通话智能体启动与运行配置

ARTCAICallAgentAsrConfig

语音识别配置

ARTCAICallAgentTtsConfig

语音合成配置

ARTCAICallAgentLlmConfig

大语言模型配置

ARTCAICallAgentAvatarConfig

数字人配置

ARTCAICallAgentInterruptConfig

打断配置

ARTCAICallAgentVoiceprintConfig

声纹降噪配置

ARTCAICallAgentTurnDetectionConfig

轮次检测配置

ARTCAICallAgentVcrConfig

VCR配置

ARTCAICallAgentVcrBaseConfig

VCR的基础检测配置

ARTCAICallAgentVcrFrameMotionConfig

VCR的视频帧检测配置

ARTCAICallExperimentalConfig

Experimental配置

ARTCAICallAgentAmbientConfig

通话环境参数

ARTCAICallAgentAutoSpeechContent

智能体在自动讲话场景下的讲话内容(包括:附和语、主动问询等)

ARTCAICallAgentAutoSpeechLlmPending

智能体在LLM 响应延迟时的播报自动讲话的配置

ARTCAICallAgentAutoSpeechUserIdle

智能体在用户静默时问询的配置

ARTCAICallAgentBackChanneling

附和语功能配置模块。开启后,智能体会在特定触发时机随机播报简短的附和语。

数据结构详情

Enum

ARTCAICallAgentType

智能体类型

枚举值

描述

VoiceAgent

0

纯语音。

AvatarAgent

1

数字人。

VisionAgent

2

视觉理解。

VideoAgent

3

视频通话。

ARTCAICallAgentState

智能体状态

枚举值

描述

Listening

1

聆听中。

Thinking

2

思考中。

Speaking

3

讲话中。

ARTCAICallNetworkQuality

网络状态

枚举值

描述

Excellent

0

网络极好,流程度清晰度质量好。

Good

1

网络好,流畅度清晰度和极好差不多。

Poor

2

网络有点差,音视频流畅度清晰度有瑕疵,不影响沟通。

Bad

3

网络差,视频卡顿严重,音频能正常沟通。

VeryBad

4

网络极差,基本无法沟通。

Disconnect

5

网络中断。

Unknow

6

未知。

ARTCAICallSpeakingInterruptedReason

智能体当前讲话被打断原因

枚举值

描述

unknown

0

未知原因。

byWords

1

因为识别到特定词。

byVoice

2

因为语音打断。

byInterruptSpeaking

3

因为调用了API:interruptSpeaking。

bySpeechBroadCast

4

因为主动语音播报打断。

byLlmQuery

5

因为主动LLM查询打断。

ARTCAICallConnectionStatus

通话过程的网络连接状态

枚举值

描述

Init

0

初始化完成。

Disconnected

1

网络连接断开。

Connecting

2

建立网络连接中。

Connected

3

网络已连接。

Reconnecting

4

重新建立网络连接中。

Failed

5

网络连接失败。

ARTCAICallAudioProfile

音频编码配置

枚举值

描述

LowQualityMode

0x0000

音频低音质模式,默认8000Hz采样率,单声道,最大编码码率12kbps。

BasicQualityMode

0x0001

标准音质模式,默认16000Hz采样率,单声道,最大编码码率24kbps。

HighQualityMode

0x0010

(默认)高音质模式,默认48000Hz采样率,单声道,最大编码码率64kbps。

StereoHighQualityMode

0x0011

立体声高音质模式,默认48000Hz采样率,双声道,最大编码码率80kbps。

SuperHighQualityMode

0x0012

超高音质模式,默认48000Hz采样率,单声道,最大编码码率96kbps。

StereoSuperHighQualityMode

0x0013

立体声超高音质模式,默认48000Hz采样率,双声道,最大编码码率128kbps。

ARTCAICallAudioScenario

音频场景配置

枚举值

描述

DefaultMode

0x0000

一般的音视频通信场景推荐使用。

MusicMode

0x0300

默认场景,音乐场景,高保真音乐音质,乐器教学等对音乐音质有要求的场景推荐使用。

ARTCAICallAgentViewMode

智能体视图渲染模式

枚举值

描述

Auto

0

自动模式。

Stretch

1

延伸模式。

Fill

2

填充模式。

Crop

3

裁剪模式。

ARTCAICallAgentViewMirrorMode

智能体视图镜像模式

枚举值

描述

OnlyFrontCameraPreviewEnabled

0

只有前置摄像头预览镜像,其余不镜像。

AllEnabled

1

镜像都开启。

AllDisabled

2

镜像都关闭。

ARTCAICallAgentViewRotationMode

智能体视图旋转模式

枚举值

描述

Rotation_0

0

视频视图旋转角度 - 0。

Rotation_90

1

视频视图旋转角度 - 90。

Rotation_180

2

视频视图旋转角度 - 180。

Rotation_270

3

视频视图旋转角度 - 270。

ARTCAICallAudioAccompanyState

音乐伴奏播放状态

枚举值

描述

ARTCAICallAudioAccompanyStarted

100

开始播放。

ARTCAICallAudioAccompanyStopped

101

停止播放。

ARTCAICallAudioAccompanyPaused

102

播放暂停。

ARTCAICallAudioAccompanyResumed

103

播放恢复。

ARTCAICallAudioAccompanyEnded

104

播放完毕。

ARTCAICallAudioAccompanyBuffering

105

正在缓冲。

ARTCAICallAudioAccompanyBufferingEnd

106

缓冲结束。

ARTCAICallAudioAccompanyFailed

107

播放失败。

ARTCAICallAudioAccompanyErrorCode

音乐伴奏播放错误码

枚举值

描述

ARTCAICallAudioAccompanyNoError

0

没有错误。

ARTCAICallAudioAccompanyUnknowError

-1

未知错误。

ARTCAICallAudioAccompanyOpenFailed

-100

打开文件失败。

ARTCAICallAudioAccompanyDecodeFailed

-101

解码文件失败。

ARTCAICallVoiceprintResult

Vad反馈结果

枚举值

描述

Off

0

没开启声纹降噪Vad,且关闭AIVad。

Unregister

1

已开启声纹降噪Vad,但还完成声纹注册。

DetectedSpeaker

2

已开启声纹降噪Vad,识别到主讲人。

UndetectedSpeaker

3

已开启声纹降噪Vad,没识别到主讲人。

DetectedSpeakerWithAIVad

4

开启AIVad,识别到主讲人。

UndetectedSpeakerWithAIVad

5

开启AIVad,但没识别到主讲人。

Unknown

100

未知。

ARTCAICallTurnDetectionMode

判断用户说话是否结束模式

枚举值

描述

Normal

0

普通模式,不使用AI进行语义判断是否说话结束,使用ASR静默时间判断。

Semantic

1

Semantic,用AI根据上下文语义,判断是否说话结束。

Class

ARTCAICallAgentInfo

智能体运行时信息

属性名

类型

描述

agentId

string

当前智能体ID。

agentType

ARTCAICallAgentType

智能体类型。

channelId

string

智能体所在的RTC频道ID。

uid

string

智能体进入RTC频道的唯一标识。

instanceId

string

当前智能体运行的实例ID。

requestId

string

当前智能体启动的请求ID。

region

string

Agent所在区域。

ARTCAICallConfig

智能体通话的配置

属性名

类型

描述

agentId

string

智能体Id。

agentType

ARTCAICallAgentType

智能体类型,必须是agentId的类型,否则启动智能体会报错。

agentUserId

string

智能体的Uid,为空时,由智能体服务分配Uid。

region

string

智能体服务所在的区域,必须是agentId所在的区域,否则启动智能体会报错。

userId

string

当前用户Id。

userJoinToken

string

当前用户的入会Token。

userData

Record<string, RecordValueType>

用户自定义信息,该信息最终传给智能体。

agentConfig

ARTCAICallAgentConfig

用于启动通话的agentConfig参数。

audioConfig

ARTCAICallAudioConfig

本地音频配置。

videoConfig

ARTCAICallVideoConfig

本地视频配置,VisionAgent/VideoAgent时才能生效。

chatSyncConfig

ARTCAICallChatSyncConfig

关联的chat智能体配置,如果设置了,那么在通话过程中会把通话记录同步到chat智能体上。

ARTCAICallAudioConfig

通话本地音频配置

属性名

类型

描述

audioProfile

ARTCAICallAudioProfile

音频编码配置,默认是HighQualityMode。

audioScenario

ARTCAICallAudioScenario

音频场景配置,默认是ARTCAICallAudioSceneMusicMode。

ignoreSetAudioProfile

boolean

SDK初始化ARTC引擎时,是否无需调用setAudioProfile接口,默认需要调用。

ARTCAICallVideoConfig

通话本地视频配置

属性名

类型

描述

dimensions

SizeOptions

推流分辨率。

frameRate

number

推流帧率。

bitrate

number

推流码率。

keyFrameInterval

number

推流关键帧间隔(毫秒)。

useHighQualityPreview

boolean

是否使用高清预览,否则SDK根据推流分辨率自动调整。

cameraCaptureFrameRate

number

预览分辨率。

useFrontCameraDefault

boolean

是否默认启动前置摄像头。

ARTCAICallViewConfig

渲染视图配置,当智能体/本地摄像头需要渲染时(例如:数字人)需要通过该类进行设置

属性名

类型

描述

controller

XComponentController

渲染视图控制器。

viewMode

ARTCAICallAgentViewMode

画面渲染模式。

viewMirrorMode

ARTCAICallAgentViewMirrorMode

画面镜像模式。

viewRotationMode

ARTCAICallAgentViewRotationMode

画面旋转模式。

ARTCAICallChatSyncConfig

关联的chat智能体会话配置参数

属性名

类型

描述

sessionId

string

关联的chat智能体会话Id。

agentId

string

关联的chat智能体Id(必须同一账号同一区域上),如果设置了,那么在通话过程中会把通话记录同步到chat智能体上。

receiverId

string

关联的chat智能体会话的用户Id。

ARTCAICallVisionCustomCaptureRequest

视觉理解智能体开启自定义截帧配置请求Model

属性名

类型

描述

text

string

请求多模态大模型时的文本参数。

enableASR

boolean

是否把人声的asr结果作为大模型的输入,如果为true,则使用人声asr结果与截帧一起送给大模型;反之,则使用text字段与截帧一起送给大模型。注意:仅在持续截帧时生效。

isSingle

boolean

true时表示单次截帧,截帧后立即退出自定义截帧状态;为false时表示持续截帧,达到duration后会自动退出自定义截帧状态。

eachDuration

number

截帧间隔时长(秒)。

num

number

每次截帧的图片数量。

duration

number

持续截帧的时长(秒),如果isSingle=true,则忽略,否则达到该设定时长时会结束自定义截帧状态。

userData

string

json字符串,自定义业务信息,跟随text和图片帧一同传给大模型,用于企业做业务处理。

ARTCAICallSendTextToAgentRequest

给智能体发送文本消息请求Model

属性名

类型

描述

text

string

询问智能体的文本消息,例如:这是什么?

ARTCAICallUserSubtitleResult

用户字幕通知结果

属性名

类型

描述

text

string

被智能体识别出的提问文本。

isSentenceEnd

boolean

当前文本是否为这句话的最终结果。

sentenceId

number

当前文本属于的句子ID。

voiceprintResult

ARTCAICallVoiceprintResult

当前声纹降噪识别结果反馈。

ARTCAICallAgentSubtitleResult

智能体字幕通知结果

属性名

类型

描述

text

string

智能体回答的文本。

isSentenceEnd

boolean

当前文本是否为此次回答的最后一句。

userAsrSentenceId

number

回答用户问题的句子ID。

ARTCAICallAgentVcrFrameMotionResult

VCR检测结果中的静音帧/无效帧检测结果

属性名

类型

描述

duration

number

多久前发送的(单位:毫秒)。

ARTCAICallAgentVcrPeopleCountResult

VCR检测结果中的实时画面人数检测结果

属性名

类型

描述

count

number

人数统计结果。

ARTCAICallAgentVcrEquipmentResult

VCR检测结果中的电子设备检测结果

属性名

类型

描述

mobilePhoneCount

number

手机备数。

watchCount

number

手表备数。

headPhoneCount

number

耳机备数。

ARTCAICallAgentVcrHeadMotionResult

VCR检测结果中的头部动作检测结果

属性名

类型

描述

nodDetected

boolean

点头。

shakeDetected

boolean

摇头。

ARTCAICallAgentVcrLookAwayResult

VCR检测结果中的视线偏移检测结果

属性名

类型

描述

count

number

截止当前帧为止,发生视线偏移的总次数。

duration

number

截止当前帧为止,视线偏移的总时长(单位:毫秒)。

ARTCAICallAgentVcrResult

VCR检测结果

属性名

类型

描述

resultData

Record<string, RecordValueType>

智能体返回的所有的VCR检测结果。

stillFrameMotionResult

ARTCAICallAgentVcrFrameMotionResult

VCR的静音帧检测结果。

invalidFrameMotionResult

ARTCAICallAgentVcrFrameMotionResult

VCR的无效帧检测结果。

peopleCountResult

ARTCAICallAgentVcrPeopleCountResult

VCR的实时画面人数检测结果。

equipmentResult

ARTCAICallAgentVcrEquipmentResult

VCR的电子设备检测结果。

headMotionResult

ARTCAICallAgentVcrHeadMotionResult

VCR的头部动作检测结果。

lookAwayResult

ARTCAICallAgentVcrLookAwayResult

VCR的头部动作检测结果。

ARTCAICallAgentShareConfig

分享智能体配置信息

属性名

类型

描述

shareId

string

智能体分享ID。

agentType

ARTCAICallAgentType

智能体工作量类型。

expireTime

string

过期时间。

region

string

Agent所在区域。

ARTCAICallAgentShareGenerateResult

分享智能体生成结果

属性名

类型

描述

agentInfo

ARTCAICallAgentInfo

分享智能体信息。

token

string

分享智能体启动Token。

ARTCAICallAgentConfig

通话智能体启动与运行配置

属性名

类型

描述

agentGreeting

string

智能体欢迎语,为空表示使用智能体配置值。

wakeUpQuery

string

用户在通话启动前的指令,用于智能体在通话启动后立即响应,例如:"今天天气怎么样?"。

agentMaxIdleTime

number

智能体闲时的最大等待时间(单位:秒),超时智能体自动下线,默认值为600s,-1则关闭自动下线(永远不会自动下线)。

userOnlineTimeout

number

用户未入会,智能体超时关闭任务的时间,默认值为60s,小于0则不会发给服务端(使用服务端默认值60s)。

userOfflineTimeout

number

用户退会后,智能体超时关闭任务的时间,默认值为5s,小于0则不会发给服务端(使用服务端默认值5s)。

enablePushToTalk

boolean

是否开启对讲机模式。

agentGracefulShutdown

boolean

是否优雅下线,优雅下线:当智能体被停止的时候,播报完当前说的话再停止,最多播报 10 秒。

volume

number

智能体说话的音量,范围为 0~400,输出音量=工作流中的语音输出音量 *

volume/100,默认值为100,小于0则不会发给服务端(使用服务端默认值100)。

workflowOverrideParams

Record<string, RecordValueType>

工作流覆盖参数。

enableIntelligentSegment

boolean

智能断句开关,开启智能断句后,用户说话的发生断句会智能合并成一句。

preConnectAudioUrl

string

接通后,播放欢迎语前的音效,支持url传入;播放完音效之后,欢迎语还是会播放。

asrConfig

ARTCAICallAgentAsrConfig

语音识别配置。

ttsConfig

ARTCAICallAgentTtsConfig

语音合成配置。

llmConfig

ARTCAICallAgentLlmConfig

大语言模型配置。

avatarConfig

ARTCAICallAgentAvatarConfig

数字人配置。

interruptConfig

ARTCAICallAgentInterruptConfig

打断配置。

voiceprintConfig

ARTCAICallAgentVoiceprintConfig

声纹降噪配置。

turnDetectionConfig

ARTCAICallAgentTurnDetectionConfig

轮次检测配置。

experimentalConfig

ARTCAICallExperimentalConfig

非产品化定制化配置。

vcrConfig

ARTCAICallAgentVcrConfig

VCR配置。

ambientConfig

ARTCAICallAgentAmbientConfig

环境配置。

backChannelingConfigs

ARTCAICallAgentBackChanneling[]

附和语功能配置模块。配置后,系统会在特定触发时机随机播报简短的附和语。

autoSpeechForLlmPendingConfig

ARTCAICallAgentAutoSpeechLlmPending

智能体在LLM 响应延迟时的播报自动讲话的配置。

autoSpeechForUserIdleConfig

ARTCAICallAgentAutoSpeechUserIdle

智能体在用户静默时问询的配置。

ARTCAICallAgentAsrConfig

语音识别配置

属性名

类型

描述

asrLanguageId

string

asr语种Id,为空表示使用智能体配置值。

asrMaxSilence

number

语音断句检测阈值,静音时长超过该阈值会被认为断句,参数范围

200ms~1200ms,默认值:-1:小于0表示跟随智能体默认配置(使用控制台配置值)。

asrHotWords

string[]

ASR热词列表。

vadLevel

number

设置AIVad的灵敏度参数,通过该参数的设定可以抗人声干扰。0表示关闭AIVad,默认值为11,小于0则不会发给服务端。

vadDuration

number

语音活动检测的最短持续时间阈值,用于控制打断的灵敏度。默认为0表示关闭此功能;有效范围:2002000毫秒,常用[200,500]

对应1-4个字。,如果设置小于0则不会把该值发给服务端(服务端默认关闭此功能)。

customParams

string

自接入ASR时,传入运行时参数,使用URL参数形式,例如:"mode=fast&sample=16000&format=wav"。

ARTCAICallAgentTtsConfig

语音合成配置

属性名

类型

描述

agentVoiceId

string

智能体讲话音色Id,为空表示使用智能体配置值。

pronunciationRules

Array<Record<string, RecordValueType>>

发音规则数组,最多支持 20 条规则。若为 nil 或空数组,则不使用任何规则。

speechRate

number

TTS播报语速,支持所有TTS类型,取值范围为[0.5,

2.0],默认值为-1,小于0表示跟随智能体默认配置(使用控制台配置值)。

languageId

string

TTS播报语种代码,当TTS类型为MiniMax有效。

emotion

string

TTS播报情绪类型,当TTS类型为MiniMax有效。

modelId

string

TTS模型Id,当前仅支持minimax,可选值:speech-01-turbo / speech-02-turbo。

ARTCAICallAgentLlmConfig

大语言模型配置

属性名

类型

描述

llmHistoryLimit

number

llm/mllm 历史对话上下文最大保留轮次,默认值为-1,小于0表示跟随智能体默认配置(使用控制台配置值)。

llmSystemPrompt

string

llm的系统提示词,例如:"你是一位友好且乐于助人的助手,专注于为用户提供准确的信息和建议。"

注意:不支持LLM节点为百炼工作流类型。

bailianAppParams

Record<string, RecordValueType>

百炼应用中心参数。

llmCompleteReply

boolean

是否发送完整的LLM结果。开启后,LLM生成结果之后,会通过onLLMReplyCompleted事件回调完整llm结果。

openAIExtraQuery

string

额外的 OpenAI 协议 LLM 的查询参数,参数必须使用 key=value 格式,多个参数用 & 连接,所有值必须为字符串类型。

outputMinLength

number

文本输出最小长度(字符数),小于该长度的文本会被缓存等待拼接,范围[0,

100],小于或等于0表示不限制,默认不限制。

outputMaxDelay

number

文本输出最大延迟时间(毫秒),超过该时间强制输出已缓存文本,。范围[1000,10000],小于或等于0表示不限制,默认不限制。

historySyncWithTTS

boolean

大模型消息历史保存,是否和tts播放内容保持一致。默认false。开启后,保存的大模型消息和tts播放内容保持一致,允许有轻微误差。

ARTCAICallAgentAvatarConfig

数字人配置

属性名

类型

描述

agentAvatarId

string

数字人模型Id,为空表示使用智能体配置值。

ARTCAICallAgentInterruptConfig

打断配置

属性名

类型

描述

enableVoiceInterrupt

boolean

是否开启智能打断。

interruptWords

string[]

触发对话打断的特定词汇或短语,例如:"打断一下"、"我知道了"。

ARTCAICallAgentVoiceprintConfig

声纹降噪配置

属性名

类型

描述

useVoiceprint

boolean

当前断句是否使用声纹降噪识别。

voiceprintId

string

声纹Id,如果不为空表示当前通话开启声纹降噪能力,为空表示不启用声纹降噪能力。

registrationMode

string

声纹的注册方式,Explicit:预注册模式,Implicit:无感注册模式,空值或其他值:等同于Explicit。

ARTCAICallAgentTurnDetectionConfig

轮次检测配置

属性名

类型

描述

turnEndWords

string[]

断句特定词,例如:"完毕"、"我讲完了"。如果设置了特定词,并且在讲话过程中触发,那么会把当前讲话的内容送给LLM。

mode

ARTCAICallTurnDetectionMode

判断用户说话是否结束模式,默认是Semantic,使用AI进行语义判断是否说话结束。

semanticWaitDuration

number

语义断句自定义等待时间,单位:毫秒,范围:[0,

10000];如果小于0则不会发给服务端(使用服务端默认值-1,AI自动判断合适的等待时间)。

ARTCAICallAgentVcrConfig

VCR配置

属性名

类型

描述

stillFrameMotion

ARTCAICallAgentVcrFrameMotionConfig

VCR的静音帧检测配置。

invalidFrameMotion

ARTCAICallAgentVcrFrameMotionConfig

VCR的无效帧检测配置。

peopleCount

ARTCAICallAgentVcrBaseConfig

VCR的实时画面人数检测配置。

equipment

ARTCAICallAgentVcrBaseConfig

VCR的电子设备检测配置。

headMotion

ARTCAICallAgentVcrBaseConfig

VCR的头部动作检测配置。

lookAway

ARTCAICallAgentVcrBaseConfig

VCR的视线偏移检测配置。

ARTCAICallAgentVcrBaseConfig

VCR的基础检测配置

属性名

类型

描述

enable

boolean

是否启用,默认开启。

ARTCAICallAgentVcrFrameMotionConfig

VCR的视频帧检测配置

属性名

类型

描述

enable

boolean

是否启用,默认开启。

callbackDelay

number

多少毫秒后触发回调,默认3000ms。

ARTCAICallExperimentalConfig

Experimental配置

属性名

类型

描述

isEnableBurstSend

boolean

是否开启音频非流式发送(SDK内部接口:sdk在启动通话时,且是语音智能体,且ARTCAICallBase.isEnableBurst=true时,会开启这个值)。

rtcSdkParams

Record<string, RecordValueType>

rtcsdk参数。

commonParams

Record<string, RecordValueType>

通用参数。

ARTCAICallAgentAmbientConfig

通话环境参数

属性名

类型

描述

volume

number

背景音音量,默认为100。

resourceId

string

控制台注册背景音后的resourceid,空字符串表示关闭。

ARTCAICallAgentAutoSpeechContent

智能体在自动讲话场景下的讲话内容(包括:附和语、主动问询等)

属性名

类型

描述

probability

number

触发概率。范围 0.0–1.0。

text

string

提示语文本,UTF-8 编码,示例:"您还在吗?" 在附和语场景限制长度最长 20

字符。在自动回复场景限制长度为最长 100 字符。

ARTCAICallAgentAutoSpeechLlmPending

智能体在LLM 响应延迟时的播报自动讲话的配置

属性名

类型

描述

waitTime

number

等待时长阈值,毫秒。超过此时长触发提示。范围 500–10000ms,不能为空。

messages

ARTCAICallAgentAutoSpeechContent[]

等待提示语集合,最大 10 条,每条长度 ≤ 100 字符,概率总和为1.0。

ARTCAICallAgentAutoSpeechUserIdle

智能体在用户静默时问询的配置

属性名

类型

描述

waitTime

number

静默时长阈值,毫秒。超过此时长触发问询。范围 5000–600000ms,建议10000。

maxRepeats

number

最大问询次数,范围 0–10,建议5。超过后不再触发,直接关闭通话。

messages

ARTCAICallAgentAutoSpeechContent[]

等待提示语集合,最大 10 条,每条长度 ≤ 100 字符,概率总和为1.0。

ARTCAICallAgentBackChanneling

附和语功能配置模块。开启后,智能体会在特定触发时机随机播报简短的附和语。

属性名

类型

描述

enabled

boolean

是否启用附和功能。

triggerStage

string

附和触发的时机。

probability

number

触发概率。范围 0.0–1.0。

words

ARTCAICallAgentAutoSpeechContent[]

等待提示语集合,最大 10 条,每条长度 ≤ 100 字符,概率总和为1.0。