AIAgentOutboundCallConfig

名称类型描述示例值
object

智能体模版参数

Greetingstring

问候语,修改后下次入会生效。默认无。

你好
EnableIntelligentSegmentboolean

智能断句开关,开启智能断句后,用户说话的发生断句会智能合并成一句。默认 true。

true
AsrConfigobject

语音识别配置

AsrMaxSilenceinteger

语音断句检测阈值,静音时长超过该阈值会被认为断句,参数范围 200ms~1200ms,默认值 400ms。

400
AsrLanguageIdstring

asr 语种 Id。 可选:

  • zh_mandarin 中文

  • en 英文

  • zh_en 中英混

  • es 西班牙语

  • jp 日语

zh_mandarin
CustomParamsstring

asr 自研接入透传参数。

mode=fast&sample=16000&format=wav
VadDurationinteger

语音活动检测的最短持续时间阈值,用于控制打断的灵敏度。0 表示关闭此功能。有效范围:200 到 2000 毫秒。常用[200,500] 对应 1-4 个字。默认为空,不生效。

300
AsrHotWordsarray

Asr 热词列表。热词列表最大支持 128 个词。

string

热词字符串。字符长度: [1,10]个字符

检查
VadLevelinteger

打断阈值参数,越高表示越难打断。取值范围:[0,10], 默认值:1。0 表示关闭 vad 功能。

1
LlmConfigobject

大语言模型配置

FunctionMaparray<object>

功能映射列表,用于将智能体能力与 LLM 函数对应。当前只支持和用户自定义 openai 协议 llm 的函数调用。

object

单个对应规则。

Functionstring

阿里智能体系统提供的内置功能名称。当前只支持 hangup(挂断)。

hangup
MatchFunctionstring

要与该功能对应的 LLM 函数名称,由客户自定义,用于在 LLM 中调用对应功能。用户自定义 llm 协议参考: LLM 标准接口

hangup
LlmHistoryLimitinteger

llm/mllm 历史对话上下文最大保留轮次,默认 10 次。

10
LlmCompleteReplyboolean

开启后,llm 生成结果之后,会向客户端发送完整 llm 结果。

true
LlmHistoryarray<object>

llm/mllm 历史对话上下文

object

单个对话

Rolestring

表示对话参与者的角色。可选值包括:

  • user: 用户

  • assistant: 助手

  • system: 系统

  • function: 函数

  • plugin: 插件

  • tool: 工具

user
Contentstring

存储实际的对话内容文本,记录了该角色在对话中的具体表达或回应。

你好
LlmSystemPromptstring

启动通话后 llm 的系统提示词。

你是一位友好且乐于助人的助手,专注于为用户提供准确的信息和建议。
OpenAIExtraQuerystring

额外的 OpenAI 协议 LLM 的查询参数, 参数必须使用 key=value 格式,多个参数用 & 连接,所有值必须为字符串类型。

api-version=2024-02-01&api-key=sk-xxx
OutputMaxDelaystring

文本输出最大延迟时间(毫秒),超过该时间强制输出已缓存文本,。范围[1000,10000],0 或空表示不限制,默认空。

2000
BailianAppParamsstring

阿里云百炼应用中心参数。参数格式参考:阿里云百炼应用中心参数

"{\"biz_params\":{\"user_defined_params\":{\"your_plugin_id\":{\"article_index\":2}}},\"memory_id\":\"your_memory_id\",\"image_list\":[\"https://your_image_url\"],\"rag_options\":{\"pipeline_ids\":[\"your_id\"],\"file_ids\":[\"文档ID1\",\"文档ID2\"],\"metadata_filter\":{\"name\":\"张三\"},\"structured_filter\":{\"key1\":\"value1\",\"key2\":\"value2\"},\"tags\":[\"标签1\",\"标签2\"]}}"
OutputMinLengthinteger

文本输出最小长度(字符数),小于该长度的文本会被缓存等待拼接,范围[0, 100],0 或空表示不限制,默认空。

5
TtsConfigobject

语音合成配置

PronunciationRulesarray<object>

Tts 发音规则,数组长度不超过 20 个,规则按顺序执行。

object

Tts 发音规则。

Typestring

具体发音规则类型。 可选:

  • replacement。直接将 Word 替换为 Pronunciation 的规则。
replacement
Wordstring

需要替换的词,长度小于 10,必须是中文字符,不支持空格。

大栅栏
Pronunciationstring

目标的发音, 长度小于 10,必须是中文字符,不支持空格。

大石烂儿
VoiceIdListarray

可选音色列表。

string

音色。

zhixiaoxia
VoiceIdstring

音色 ID,修改后下句话生效。不填写则使用智能体模版配置的音色 ID。仅针对预置 TTS 生效。输入长度不超过 64。可选值参考:智能语音效果示例

longcheng_v2
Emotionstring

当前仅支持 minimax,minimax 当前支持 7 种情绪:

  • happy:高兴
  • sad:悲伤
  • angry:愤怒
  • fearful:害怕
  • disgusted:厌恶
  • surprised:惊讶
  • calm:中性
happy
ModelIdstring

当前仅支持 minimax,可选值: speech-01-turbo / speech-02-turbo

speech-01-turbo
LanguageIdstring

当前仅支持 minimax,默认为空。增强对指定的小语种和方言的识别能力,设置后可以提升在指定小语种/方言场景下的语音表现。如果不明确小语种类型,则可以选择"auto",模型将自主判断小语种类型。支持以下取值:

支持语种
  • Chinese:中文
  • Chinese,Yue:粤语
  • English:英语
  • Arabic:阿拉伯语
  • Russian:俄语
  • Spanish:西班牙语
  • French:法语
  • Portuguese:葡萄牙语
  • German:德语
  • Turkish:土耳其语
  • Dutch:荷兰语
  • Ukrainian:乌克兰语
  • Vietnamese:越南语
  • Indonesian:印度尼西亚语
  • Japanese:日语
  • Italian:意大利语
  • Korean:韩语
  • Thai:泰语
  • Polish:波兰语
  • Romanian:罗马尼亚语
  • Greek:希腊语
  • Czech:捷克语
  • Finnish:芬兰语
  • Hindi:印地语
  • auto:自动检测
Chinese
SpeechRatedouble

支持全平台。 cosyvoice 默认 1.0,取值范围:0.5-2.0。 minimax 默认 1.0, 取值范围: 0.5-2.0。

1.0
InterruptConfigobject

语音打断策略配置。

InterruptWordsarray

触发对话中断的特定词汇或短语。

string

触发对话中断的特定词汇或短语。

打断一下
EnableVoiceInterruptboolean

是否支持语音打断,默认 true。

true
TurnDetectionConfigobject

对话轮次检测配置

SemanticWaitDurationinteger

AI 模式下的停顿判定时间,单位:毫秒,默认值-1。

  • -1: AI 自动判断合适的等待时间

  • 0-10000: 自定义等待时间,建议设置在 0-1500ms

注意:普通模式下此项无效

-1
TurnEndWordsarray

用于判断用户轮次结束的关键词列表

string

用于判断用户轮次结束的关键词

我说完了
Modestring

轮次检测的模式。

  • Normal:普通模式,不使用 AI 判断语义;

  • Semantic:用 AI 根据上下文语义,判断是否说完话了。

默认值 Normal。

Semantic
GreetingDelayinteger

欢迎语延迟时间,单位毫秒,默认 0 毫秒,范围:0-5000ms

0
AmbientSoundConfigobject

通话环境音配置。

ResourceIdstring

通话环境音 ID,可以在控制台上智能体配置的高级配置中获取。

f67901c595834************
Volumeinteger

通话背景音的音量,可选值:[0, 100],0 表示关闭。

50