什么是通义万相数字人

更新时间:
复制为 MD 格式

通义万相是提供数字人制作及应用服务的一站式工厂,主要服务于多样化的数字人资产定制(通过视频、图片、3D资产等方式训练数字人),数字人资产可搭配视频合成(如:课程培训视频)、直播(如:电商带货)、互动娱乐或教学(如:口语陪练、儿童教育等)等应用,用于满足客户的数字人替代真人出镜的需求。

控制台功能

产品能力概述中提到的各项能力,均可以在万相数字人平台的控制台中体验到。

  • 数字人形象及音色定制

    • 2D数字人资产:提供海量官模,同时支持2D视频、图片数字人个性化定制

    • 3D数字人资产:提供海量写实3D数字人、卡通数字人官模

    • 声音克隆:原声级复刻声音本真,打造音容兼具真实感的数字人

  • 数字人视频创作

    • 基于2D视频数字人、图片数字人服务,提供2D数字人形象的视频创作Saas工具,支持输入文本,驱动数字人形象生成视频,并下载视频内容

  • 数字人实时对话

    • 提供数字人实时对话能力,整合ASR、TTS、LLM、数字人驱动、数字人音色定制等功能,支持新一代端到端高表现力对话数字人效果实现,为终端用户提供7x24小时的专业服务

产品优势

  • 极低成本:支持图片数字人的即时训练和播报视频生成,无需搭建影棚拍摄可获得指定播报动作的形象视频输出。

  • 效果卓越:形象面部表情、唇型与语音的匹配度高,数字人口播自然准确,能够模仿真人表情和动作。

  • 开盒即用:数字人实时对话,结合不同行业和场景,支持接入匹配的任务Agent,提供开盒即用的差异化数字人体验和解决方案;

  • 输出灵活:数字人视频创作,支持横屏竖屏、多种分辨率的视频格式,保障视频清晰度,应用范围广泛。

相关文档

要使用通义万相数字人平台开发自己的数字人产品,请参考以下文档链接

操作指南