产品发布公告

更新时间:
复制为 MD 格式

本文介绍数字人应用平台的功能发布记录,便于您快速查看最近升级能力。

202512

功能项

功能简述

链接

实时对话支持展示各部分延时

  • 控制台支持展示当次对话端到端延时以及当轮对话各部分延时(LLM、TTS、数字人)

2D数字人实时对话

3D数字人实时对话

实时对话支持调节语音配置

  • 实时对话项目编辑页支持调整TTS语速和音调

2D数字人实时对话

3D数字人实时对话

图片数字人模型升级

  • 图片数字人(指定动作)版升级为图片训练数字人,手动、肢体动作升级为生成式

  • 图片训练数字人支持在实时对话场景中使用

2D数字人形象类别介绍

图片训练版-2D数字人形象定制

支持API方式调用

  • 支持API方式克隆自定义音色并查询状态

CreateTTSVoiceCustom - 自定义语音克隆

ListPrivateTTSVoicesCustom - 自定义语音查询

  • 支持API方式创建图片数字人

CreateTrainPicAvatar - 创建图片训练数字人。

CreateNoTrainPicAvatar - 创建免训图片数字人

202511

功能项

功能简述

链接

语音能力升级

  • 语音克隆和合成模型双升级,能高度还原发音人的语音特征,质量和自然度显著提升

-

数字人对话支持透明背景推流

  • 数字人对话支持透明背景推流,无缝融入更多个性化场景,提升沉浸式交互感。

2D数字人实时对话

3D数字人实时对话

202510

功能项

功能简述

链接

数字人对话新增语言模型选择

  • 预置模型增加千问前问- character模型

  • 支持选择通义星尘应用

2D数字人实时对话

图片数字人商业化

  • 图片数字人限免期结束,需完成商业化购买后创建

2D数字人私模定制

官方音色新增

  • 新增数十款个性化音色,覆盖日语、韩语小语种

-

20259

功能项

功能简述

链接

数字人对话新增开场白配置

  • 数字人对话新增开场白配置,可自定义初始交互话术,优化初始交互体验

2D数字人实时对话

3D数字人实时对话

20258

功能项

功能简述

链接

产品公测发布

  • 数字人应用平台是数字人制作及应用服务的一站式工厂,主要服务于多样化的数字人资产定制,数字人资产可搭配视频合成、直播、互动娱乐或教学等应用,用于满足客户的数字人替代真人出镜的需求。