StartAgent - 启动智能体

启动AI Agent

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

授权信息

下表是API对应的授权信息,可以在RAM权限策略语句的Action元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:

  • 操作:是指具体的权限点。
  • 访问级别:是指每个操作的访问级别,取值为写入(Write)、读取(Read)或列出(List)。
  • 资源类型:是指操作中支持授权的资源类型。具体说明如下:
    • 对于必选的资源类型,用前面加 * 表示。
    • 对于不支持资源级授权的操作,用全部资源表示。
  • 条件关键字:是指云产品自身定义的条件关键字。
  • 关联操作:是指成功执行操作所需要的其他权限。操作者必须同时具备关联操作的权限,操作才能成功。
操作访问级别资源类型条件关键字关联操作
rtc:StartAgentcreate
*App
acs:rtc::{#accountId}:app/{#AppId}

请求参数

名称类型必填描述示例值
AppIdstring

应用 ID,可通过控制台创建和查询,仅支持传单个 ID。

aoe****
ChannelIdstring

加入的频道,仅支持传单个 ID。

yourChannelId
TaskIdstring

任务 id

yourTaskId
TemplateIdstring

模版 ID。

76dasgb****
RtcConfigobject

智能体加入 rtc 频道的配置

UserIdstring

智能体在 rtc 频道中的 userId

423341
TargetUserIdsarray

智能体订阅的用户 userId 列表,目前仅支持一个

string

userId

41411
UserInactivityTimeoutinteger

定义用户无活动状态的最大持续时间阈值(单位:秒) 当检测到以下任一状态持续时间达到该阈值时,智能体将自动停止并退出频道:

  1. targetUserIds 列表中的所有用户已全部离开频道
  2. targetUserIds 列表未加入频道

默认值:30 取值范围:[5, 180]

30
VoiceChatConfigobject

AI 语音对话的配置

ChatModeinteger

1-自然对话模式 (默认值); 2-对讲机模式

1
InterruptModeinteger

1-支持语音打断 (默认值),2-禁用语音打断

1
Greetingstring

问候语

早上好,我的朋友
ASRConfigobject

ASR 配置

SourceLanguagestring

无需设置

zh
SemanticPunctuationEnabledboolean

语义断句/语音断句

false
MaxSentenceSilenceinteger

语音断句检测阈值,默认 800ms,参考范围[200,6000]

800
VocabularyIdstring

支持的热词 ID

vocab-xxx-24ee19fa8cfb4d52902170a0xxxxxxxx
LanguageHintsarray

不设置,模型会自动识别语种。 目前支持的语言代码: zh: 中文(支持方言:上海话、吴语、闽南语、东北话、甘肃话、贵州话、河南话、湖北话、湖南话、江西话、宁夏话、山西话、陕西话、山东话、四川话、天津话、云南话、粤语) en: 英文 ja: 日语 yue: 粤语 ko: 韩语

string

语言代码

zh
VadConfigobject

vad 配置。

InterruptSpeechDurationinteger

人声持续阈值 (ms),取值范围为[0,3000]。持续检测到人声信号的最小时间长度,避免误打断。 默认 300ms

300
LLMConfigobject

LLM 配置

Vendorstring

接入云服务提供商时,此字段表示服务商的名称。示例:aliyun[百炼]、thirdparty

aliyun
Modelstring

模型名称 aliyun 服务商下支持模型: ["qwen-plus", "deepseek-r1", "qwen-omni-turbo"]

qwen-plus
ApiKeystring

服务商 apikey

xxxxxxxxxxx
Temperaturedouble

采样温度,用于控制生成文本的随机性和创造性,值越大随机性越高。 默认值 0.7 取值范围[0,2) deepseek-r1 设置该参数不生效

0.7
TopPdouble

采样的选择范围,控制输出 token 的多样性。模型将从概率分布中累计概率超过该取值的标记中进行采样,以确保采样的选择范围不会过宽,值越大输出的 token 类型越丰富。 取值范围(0,1],默认值 0.8

0.8
MaxTokeninteger

输出文本的最大限制,默认值 8192 deepseek qwen 模型最大值为 8192

500
HistoryDepthinteger

给大模型提供多少历史对话轮次。 默认值 3

3
Promptstring

用于告知模型要扮演的角色或行为

xxxx
Urlstring

接入第三方的大模型时,此字段表示大模型的接入 url

https://xxxxx
Paramsobject

用户自定义参数,键值对

{\"verification_code\": \"xxx\"}
AppIdstring

智能体应用 ID model,appId 二选一即可。如果 model,appId 都填写了,优先使用 appId

e****
TTSConfigobject

TTS 配置

Vendorstring

服务提供商 【aliyun【百炼】】

aliyun
Modelstring

模型名称【cosyvoice-v1】

cosyvoice-v1
ApiKeystring

服务商 apikey

xxxxxx
Voicestring

音色。如果选择阿里云 cosyvoice-v1,默认音色是 longxiaoxia 可选音色: longwan、longcheng、longhua、longxiaochun、longxiaoxia、longxiaocheng、longxiaobai、longlaotie、longshu、longshuo、longjing、longmiao、longyue、longyuan、longfei、longjielidou、longtong、longxiang、loongstella、loongbella

longxiaoxia
Volumeinteger

音量(int),[0~100],默认 50

50
Ratedouble

语速(float)[0.5~2.0],默认 1.0

1
Pitchdouble

音调(float)[0.5~2.0],默认 1.0

1
FilterBracketsarray

过滤设定符号范围内的字符不被转成语音

integer

1-中文刮号(),2-英文刮号(),3-中文方头刮号【】,4-英文方刮号[],5-英文花刮号{}

[1,2]
AgentSilenceConfigobject

当用户加入频道后,但未与智能体进行有效交互(用户未发言),此时智能体处于静默状态,可以配置智能体在静默状态下的行为:播报静默语音消息提醒或 webhook 通知。

Enableboolean

开关

false
AlertTimeoutinteger

静默提醒的超时时间(单位:秒)。 可能多次触发,若智能体静默提醒超时后依然静默,则再超时还会继续触发 取值范围:[5, 600],默认值 0,0 表示不提醒

0
Strategyinteger

静默提醒的话术策略。 1 - 向用户语音播报 content 指定的提示消息 2 - 把 content 指定的提示消息和历史对话发送给 LLM,并播报模型生成的回复 默认值:1

1
Contentstring

静默提示消息的内容

**
WebhookTriggerTimeoutinteger

触发智能体静默超时 webhook 的静默超时时间(单位:秒)。可能多次触发,若智能体 webhook 静默超时后依然静默,则再超时还会继续触发 取值范围:[10, 600],默认值 0,0 表示不触发

0
AmbientSoundConfigobject

环境音设置

SoundIdstring

环境音计划支持内置与下载(后续),当前先实现内置模式

  • 当不传字段或者字段为空时,表示不开启环境音
  • 内置模式:agent 提供以下默认环境音:white_noise(白噪声)office(办公室)
  • 下载模式:支持客户在控制台填写 soundId(不可与内置 id 相同),并填写 url,agent 内部会进行下载并绑定。
white_noise
Volumeinteger

环境音音量,默认 50(原声)。范围【0 - 100】

50
InterruptConfigobject

打断设置

SemanticsInterruptboolean

是否开启语义打断。默认值是 true

true
BackChannelConfigobject

承接词设置

UserTurnEndboolean

用户说完话后,是否开启承接词。默认值是 false

false

返回参数

名称类型描述示例值
object

Schema of Response

RequestIdstring

Id of the request

6159ba01-6687-4fb2-a831-f0cd8d188648

示例

正常返回示例

JSON格式

{
  "RequestId": "6159ba01-6687-4fb2-a831-f0cd8d188648"
}

错误码

访问错误中心查看更多错误码。

变更历史

变更时间变更内容概要操作
暂无变更历史