API概览

更新时间:
复制为 MD 格式

API标准及多语言预置SDK

本产品(数字人应用/2025-05-27)的 OpenAPI 采用 ROA 签名机制,具体签名方式请参见签名机制说明我们已为开发者封装了主流编程语言的 SDK,您可通过 下载 SDK 快速调用 API,无需关注签名等底层实现细节,显著降低开发门槛与集成复杂度。

自定义签名场景

若您的业务场景有特殊需求,需通过自签名方式对接 API,建议优先咨询我们的技术支持团队(服务钉钉群:147535001692),获取专业指导以确保高效接入。

账号与安全准备

阿里云账号具备对所有资源的完全管理权限。一旦 AccessKey 泄露,所有相关资源都将面临未经授权访问的风险。为确保安全,建议创建一个仅具备 API 访问权限的 RAM 用户并配置其 AccessKey,同时基于最小权限原则 (PoLP) 配置 RAM 策略。仅在明确需要阿里云账号权限的特定场景下,才使用阿里云账号。

数字人播报

API标题API概述
CreateBroadcastSticker创建播报贴图创建播报贴图。
ListBroadcastTemplates列举播报模板列举播报模板。
GetBroadcastTemplate查询播报模板详情查询播报模板详情。
CreateBroadcastVideoFromTemplate基于模版创建播报视频基于播报模板合成视频。
ListBroadcastVideosById根据id列表批量查询播报视频根据id列表批量查询播报视频。当您新提交任务后,建议您参照文字对应的音频时间长度,至少等待6倍时间后进行查询视频合成结果。
CreateBroadcastAudio创建播报音频创建播报音频。
ListBroadcastAudiosById根据id列表批量查询播报音频根据id列表批量查询播报音频。

数字人资产合成与管理

API标题API概述
GetUploadPolicy获取上传凭证获取对话免训图片素材上传凭证。
音色音色
CreateTTSVoiceCustom自定义语音克隆
GetTTSVoiceByIdCustom自定义语音单个音色查询查询自定义音色是否创建成功,建议您创建后至少等待1分钟再进行查询。
ListPrivateTTSVoicesCustom自定义语音查询查看属于自己的音色列表。新增的自定义音色,建议您创建后至少等待1分钟再进行查询。
图片数字人图片数字人
ListTemplateMaterial底板素材分页查询。
CreateTrainPicAvatar创建图片训练数字人。创建图片训练数字人。
ConfirmTrainPicAvatar结果确认。
GetTrainPicAvatarStatus查询图片训练数字人的状态。查询图片数字人的训练状态,建议您在提交训练任务后,等待至少20分钟后进行结果的查询。
对话背景图对话背景图
CreateBackgroundPic创建背景素材创建背景素材。
图片免训数字人图片免训数字人
CreateNoTrainPicAvatar创建免训图片数字人创建对话免训照片数字人。

数字人对话

API标题API概述
CreateChatConfig创建对话配置背景配置。
CreateChatSession创建实时数字人会话创建实时数字人会话。
CloseChatInstanceSessions关闭实例下的会话关闭会话实例session。
QueryChatInstanceSessions查询实例下的活跃会话查询会话实例session。