API标准及多语言预置SDK
本产品(数字人应用/2025-05-27)的 OpenAPI 采用 ROA 签名机制,具体签名方式请参见签名机制说明。我们已为开发者封装了主流编程语言的 SDK,您可通过 下载 SDK 快速调用 API,无需关注签名等底层实现细节,显著降低开发门槛与集成复杂度。自定义签名场景
若您的业务场景有特殊需求,需通过自签名方式对接 API,建议优先咨询我们的技术支持团队(服务钉钉群:147535001692),获取专业指导以确保高效接入。
账号与安全准备
阿里云账号具备对所有资源的完全管理权限。一旦 AccessKey 泄露,所有相关资源都将面临未经授权访问的风险。为确保安全,建议创建一个仅具备 API 访问权限的 RAM 用户并配置其 AccessKey,同时基于最小权限原则 (PoLP) 配置 RAM 策略。仅在明确需要阿里云账号权限的特定场景下,才使用阿里云账号。
数字人播报
| API | 标题 | API概述 |
|---|---|---|
| CreateBroadcastSticker | 创建播报贴图 | 创建播报贴图。 |
| ListBroadcastTemplates | 列举播报模板 | 列举播报模板。 |
| GetBroadcastTemplate | 查询播报模板详情 | 查询播报模板详情。 |
| CreateBroadcastVideoFromTemplate | 基于模版创建播报视频 | 基于播报模板合成视频。 |
| ListBroadcastVideosById | 根据id列表批量查询播报视频 | 根据id列表批量查询播报视频。当您新提交任务后,建议您参照文字对应的音频时间长度,至少等待6倍时间后进行查询视频合成结果。 |
| CreateBroadcastAudio | 创建播报音频 | 创建播报音频。 |
| ListBroadcastAudiosById | 根据id列表批量查询播报音频 | 根据id列表批量查询播报音频。 |
数字人资产合成与管理
| API | 标题 | API概述 |
|---|---|---|
| GetUploadPolicy | 获取上传凭证 | 获取对话免训图片素材上传凭证。 |
| 音色 | 音色 | |
| CreateTTSVoiceCustom | 自定义语音克隆 | |
| GetTTSVoiceByIdCustom | 自定义语音单个音色查询 | 查询自定义音色是否创建成功,建议您创建后至少等待1分钟再进行查询。 |
| ListPrivateTTSVoicesCustom | 自定义语音查询 | 查看属于自己的音色列表。新增的自定义音色,建议您创建后至少等待1分钟再进行查询。 |
| 图片数字人 | 图片数字人 | |
| ListTemplateMaterial | 底板素材分页查询。 | |
| CreateTrainPicAvatar | 创建图片训练数字人。 | 创建图片训练数字人。 |
| ConfirmTrainPicAvatar | 结果确认。 | |
| GetTrainPicAvatarStatus | 查询图片训练数字人的状态。 | 查询图片数字人的训练状态,建议您在提交训练任务后,等待至少20分钟后进行结果的查询。 |
| 对话背景图 | 对话背景图 | |
| CreateBackgroundPic | 创建背景素材 | 创建背景素材。 |
| 图片免训数字人 | 图片免训数字人 | |
| CreateNoTrainPicAvatar | 创建免训图片数字人 | 创建对话免训照片数字人。 |
数字人对话
| API | 标题 | API概述 |
|---|---|---|
| CreateChatConfig | 创建对话配置 | 背景配置。 |
| CreateChatSession | 创建实时数字人会话 | 创建实时数字人会话。 |
| CloseChatInstanceSessions | 关闭实例下的会话 | 关闭会话实例session。 |
| QueryChatInstanceSessions | 查询实例下的活跃会话 | 查询会话实例session。 |