首页 虚拟数字人开放平台 产品简介 什么是虚拟数字人开放平台

什么是虚拟数字人开放平台

本文档介绍虚拟数字人开放平台的功能特性、应用场景、产品优势等相关信息。

虚拟数字人开放平台,是由阿里云所提供的数字人 PaaS & SaaS 解决方案,它集成了自然语言处理、图形图像、语音等算法能力,提供给客户标准的 PaaS 接口与 SaaS运营工具,方便客户将数字人能力集成进不同的终端与场景。主要面对的行业包括新零售、政务、金融、运营商、传媒等,场景包括数字人信息播报等。

产品架构

产品架构图

功能特性

SaaS 模块

子模块

模块内容

数字人管理

新建数字人应用

设置应用名称、关联的实例

业务列表

配置关联的数字人形象、字幕开关、页面布局,并提供开发者信息

数字人供应

新建角色

创建新的数字人,设置角色名称、角色描述

形象设置

对数字人的发型、妆容、服装、声音以及背景进行设置

PaaS 模块

模块内容

TTS 数字人流媒体接口

将文本转换为数字人流媒体(TTS:Text To Stream),目前仅支持720*1280分辨率输出。

RTC SDK

集成在客户的端上用于推拉流

应用场景

  • 数字人信息播报:通过 PaaS 接口传递数字人即将播报的文本,可以获得数字人播报的视频流,通过在端上集成 RTC 拉流可以实现数字人在线直播、数字人助理播报等效果。

产品优势

  • 简单高效的 PaaS 服务接口

客户调用虚拟数字人能力只需要通过标准的 TTS 数字人流媒体接口即可,无需关注底层数字人驱动的具体实现方式。

  • 完善的 SaaS 运营工具

支持自定义数字人的声音、形象等,内置数十种数字人装扮,方便客户针对不同业务属性创建不同风格的数字人形象。

  • 语音、视觉多模态交互

毫秒级实时的语音流、视频流处理技术,数字人实现语音、表情、手势动作和环境的多维度多方位立体交互。

使用虚拟数字人开放平台

详情请见接入指南数字人流媒体开发指南

阿里云首页 虚拟数字人 相关技术圈