通义万相是提供数字人制作及应用服务的一站式工厂,主要服务于多样化的数字人资产定制(通过视频、图片、3D资产等方式训练数字人),数字人资产可搭配视频合成(如:课程培训视频)、直播(如:电商带货)、互动娱乐或教学(如:口语陪练、儿童教育等)等应用,用于满足客户的数字人替代真人出镜的需求。
控制台功能
产品能力概述中提到的各项能力,均可以在万相数字人平台的控制台中体验到。
2D数字人资产:提供海量官模,同时支持2D视频、图片数字人个性化定制
3D数字人资产:提供海量写实3D数字人、卡通数字人官模
声音克隆:原声级复刻声音本真,打造音容兼具真实感的数字人
基于2D视频数字人、图片数字人服务,提供2D数字人形象的视频创作Saas工具,支持输入文本,驱动数字人形象生成视频,并下载视频内容
提供数字人实时对话能力,整合ASR、TTS、LLM、数字人驱动、数字人音色定制等功能,支持新一代端到端高表现力对话数字人效果实现,为终端用户提供7x24小时的专业服务
产品优势
极低成本:支持图片数字人的即时训练和播报视频生成,无需搭建影棚拍摄可获得指定播报动作的形象视频输出。
效果卓越:形象面部表情、唇型与语音的匹配度高,数字人口播自然准确,能够模仿真人表情和动作。
开盒即用:数字人实时对话,结合不同行业和场景,支持接入匹配的任务Agent,提供开盒即用的差异化数字人体验和解决方案;
输出灵活:数字人视频创作,支持横屏竖屏、多种分辨率的视频格式,保障视频清晰度,应用范围广泛。
相关文档
要使用通义万相数字人平台开发自己的数字人产品,请参考以下文档链接
操作指南
该文章对您有帮助吗?