数字人视频合成开发指南
本文介绍数字人视频合成服务的接入流程和相关开发方案。
数字人视频合成服务(包括3D数字人视频合成和2D数字人视频合成)提供根据指定文本让数字人进行文本播报,平台会基于数字人播报的文本智能同步驱动数字人做出相应的嘴型、表情和动作,同时将渲染的数字人画面合成指定格式的视频文件。目前平台支持合成透明格式的视频和特定绿幕背景的非透明视频,更多信息可以参考下方的详细接入使用指南。
下面详细介绍下数字人视频合成服务的使用链路。
1. 完整的技术链路图:

2. 核心链路介绍
2.1 提交数字人视频合成任务
目的:
提交数字人视频合成任务,获取到对应的任务ID。
核心流程:
通过调用虚拟数字人开放平台服务端SDK的提交视频合成任务API(目前平台服务端SDK支持java/python/php三种开发语言,具体接入方案可参考服务端API接入),获取到API返回的任务ID。
2.2 轮询数字人视频合成任务状态
目的:
根据上一步获取到的视频合成任务ID获取对应的任务状态。
核心流程:
通过调用虚拟数字人开放平台服务端SDK的查询视频合成任务状态API,获取对应视频合成任务的状态,由于数字人视频合成需要一定的时间,所以该接口需要定时轮询调用,建议轮询间隔3s,轮询过于频繁可能会导致查询失败。查询任务状态直到状态显示为已完成或者失败,状态为已完成的时候可以获取到对应的视频下载URL,然后直接通过URL可以下载到对应的视频,针对失败的任务可以根据对应的失败原因进行修改重新提交。
以上就是一个完整的数字人视频合成服务的使用链路,关于数字人视频合成服务更多信息可参考下方详细的使用指南: