什么是虚拟数字人开放平台
本文档介绍虚拟数字人开放平台的功能特性、应用场景、产品优势等相关信息。
虚拟数字人开放平台,是由阿里云所提供的数字人 PaaS & SaaS 解决方案,它集成了自然语言处理、图形图像、语音等算法能力,提供给客户标准的 PaaS 接口与 SaaS运营工具,方便客户将数字人能力集成进不同的终端与场景。主要面对的行业包括新零售、政务、金融、运营商、传媒等,场景包括数字人信息播报等。
产品架构

功能特性
SaaS 模块 | 子模块 | 模块内容 |
数字人管理 | 新建数字人应用 | 设置应用名称、关联的实例 |
业务列表 | 配置关联的数字人形象、字幕开关、页面布局,并提供开发者信息 | |
数字人供应 | 新建角色 | 创建新的数字人,设置角色名称、角色描述 |
形象设置 | 对数字人的发型、妆容、服装、声音以及背景进行设置 |
PaaS 模块 | 模块内容 | |
TTS 数字人流媒体接口 | 将文本转换为数字人流媒体(TTS:Text To Stream),目前仅支持720*1280分辨率输出。 | |
RTC SDK | 集成在客户的端上用于推拉流 |
应用场景
数字人信息播报:通过 PaaS 接口传递数字人即将播报的文本,可以获得数字人播报的视频流,通过在端上集成 RTC 拉流可以实现数字人在线直播、数字人助理播报等效果。
产品优势
简单高效的 PaaS 服务接口
客户调用虚拟数字人能力只需要通过标准的 TTS 数字人流媒体接口即可,无需关注底层数字人驱动的具体实现方式。
完善的 SaaS 运营工具
支持自定义数字人的声音、形象等,内置数十种数字人装扮,方便客户针对不同业务属性创建不同风格的数字人形象。
语音、视觉多模态交互
毫秒级实时的语音流、视频流处理技术,数字人实现语音、表情、手势动作和环境的多维度多方位立体交互。
使用虚拟数字人开放平台
详情请见接入指南与数字人流媒体开发指南。