阿里云百炼提供多样化的视频模型选择,涵盖文生视频、图生视频(通用/舞蹈/唱演/播报等)、视频编辑(视频风格重绘/视频口型替换)等应用场景。
模型总览
类别 | 说明 |
类别 | 说明 |
文生视频 |
|
图生视频 |
|
视频编辑 |
|
支持的模型
文生视频
通义万相-文生视频模型通过一句话即可生成视频,视频呈现丰富的艺术风格及影视级画质。API参考 |在线体验
模型名称 | 说明 | 单价 | 免费额度 |
模型名称 | 说明 | 单价 | 免费额度 |
wanx2.1-t2v-turbo | 生成速度更快,表现均衡。 | 0.24元/秒 | 各200秒 有效期:百炼开通后180天内 |
wanx2.1-t2v-plus | 生成细节更丰富,画面更具质感。 | 0.70元/秒 |
输入示例 | 输出视频 |
输入提示词:一只小猫在月光下奔跑 |
图生视频-基于首帧
通义万相-图生视频模型将输入图片作为视频首帧,再根据提示词生成视频。视频呈现丰富的艺术风格及影视级画质。API参考 |在线体验
模型名称 | 说明 | 单价 | 免费额度 |
模型名称 | 说明 | 单价 | 免费额度 |
wanx2.1-i2v-turbo | 生成速度更快,耗时仅为plus模型的三分之一,性价比更高。 | 0.24元/秒 | 各200秒 有效期:百炼开通后180天内 |
wanx2.1-i2v-plus | 生成细节更丰富,画面更具质感。 | 0.70元/秒 |
输入示例 | 输出视频 |
输入示例 | 输出视频 |
输入提示词:一只猫在草地上奔跑 输入图片: | 输出视频:将图片作为视频的第一帧,再根据提示词生成视频。 模型:wanx2.1-i2v-turbo。 |
图生视频-基于首尾帧
通义万相-首尾帧生视频模型,只需要提供首帧和尾帧图片,便能根据提示词生成一段丝滑流畅的动态视频。API参考 | 在线体验
模型名称 | 单价 | 免费额度 |
模型名称 | 单价 | 免费额度 |
wanx2.1-kf2v-plus | 0.70元/秒 | 200秒 有效期:百炼开通后180天内 |
输入示例 | 输出视频 | ||
首帧图片 | 尾帧图片 | 提示词 | |
写实风格,一只黑色小猫好奇地看向天空,镜头从平视逐渐上升,最后俯拍小猫好奇的眼神。 |
舞动人像AnimateAnyone
基于人物图片和人物动作模板,生成人物动作视频。直接使用时需依次调用下述三个模型。AnimateAnyone图像检测 API详情 | AnimateAnyone 动作模板生成API详情| AnimateAnyone视频生成API详情
模型名称 | 说明 | 单价 | 免费额度 |
模型名称 | 说明 | 单价 | 免费额度 |
animate-anyone-detect-gen2 | 检测输入的图片是否符合要求 | 0.004元/张 | 200张 有效期:百炼开通后180天内 |
animate-anyone-template-gen2 | 从人物运动视频中提取人物动作并生成动作模板 | 0.08元/秒 | 各1800秒 有效期:百炼开通后180天内 |
animate-anyone-gen2 | 基于人物图片和动作模板生成人物动作视频 |
下面两个模型支持独立部署。模型部署后,模型调用参考这两个API详情。AnimateAnyone图像检测 API详情 | AnimateAnyone视频生成API详情
模型名称 | 说明 | 单价 | 免费额度 |
模型名称 | 说明 | 单价 | 免费额度 |
animate-anyone-detect | 检测输入图片是否符合要求 | 当前仅支持部署后调用,仅收取部署费用。部署单价:
| 无 |
animate-anyone | 基于人物图片和动作模板生成人物动作视频 |
舞动人像模型效果示例
输入:人物图片 | 输入:动作视频 | 输出(按图片背景生成) | 输出(按视频背景生成) |
输入:人物图片 | 输入:动作视频 | 输出(按图片背景生成) | 输出(按视频背景生成) |
以上示例,由集成了“舞动人像AnimateAnyone”的通义APP生成。
舞动人像AnimateAnyone模型的生成内容为视频画面,不包含音频。
悦动人像EMO
基于人物肖像图片和人声音频文件,生成人物肖像动态视频。使用时需依次调用下述模型。EMO 图像检测API详情 | EMO 视频生成API详情
emo-detect-v1与emo-detect、emo-v1与emo在调用方式及计费方式中有区别,模型效果完全相同。
模型名称 | 说明 | 单价 | 免费额度 |
模型名称 | 说明 | 单价 | 免费额度 |
emo-detect-v1 | 检测输入的图片是否符合要求,不需要部署,可直接调用 | 0.004元/张 | 200张 有效期:百炼开通后180天内 |
emo-v1 | 生成人物肖像动态视频,不需要部署,可直接调用 |
| 1800秒 有效期:百炼开通后180天内 |
emo-detect | 检测输入的图片是否符合要求,仅支持部署后调用 | 当前仅支持部署后调用,仅收取部署费用。 部署单价:20元/算力单元/小时 | 无 |
emo | 生成人物肖像动态视频,仅支持部署后调用 |
输入物:人物肖像图片+人声音频文件 | 输出物:人物肖像动态视频 |
输入物:人物肖像图片+人声音频文件 | 输出物:人物肖像动态视频 |
人物肖像: 人声音频:参见右侧视频 | 人物视频: 使用动作风格强度:活泼("style_level": "active") |
灵动人像LivePortrait
基于人物肖像图片和人声音频文件,快速、轻量地生成人物肖像动态视频。与悦动人像EMO模型相比,生成速度快、价格低,但是生成效果不如悦动人像EMO模型。使用时需依次调用下述两个模型。LivePortrait 图像检测API详情 | LivePortrait 视频生成API详情
模型名称 | 说明 | 单价 | 免费额度 |
模型名称 | 说明 | 单价 | 免费额度 |
liveportrait-detect | 检测输入的图片是否符合要求 | 0.004元/张 | 200张 有效期:百炼开通后180天内 |
liveportrait | 生成人物肖像动态视频 | 0.02元/秒 | 1800秒 有效期:百炼开通后180天内 |
输入物:人物肖像图片+人声音频文件 | 输出物:人物肖像动态视频 |
输入物:人物肖像图片+人声音频文件 | 输出物:人物肖像动态视频 |
人物肖像: 人声音频:参见右侧视频 | 人物视频: |
表情包Emoji
基于人脸图片和预设的人脸动态模板,生成人脸动态视频。该能力可用于表情包制作、视频素材生成等场景。使用时需依次调用下述模型。Emoji 图像检测API详情 | Emoji 视频生成API详情
模型名称 | 说明 | 单价 | 免费额度 |
模型名称 | 说明 | 单价 | 免费额度 |
emoji-detect-v1 | 检测输入图片是否符合要求 | 0.004元/张 | 200张 有效期:百炼开通后180天内 |
emoji-v1 | 基于人物肖像图片和指定的表情包模板生成人物同款表情 | 0.08元/秒 | 500秒 有效期:百炼开通后180天内 |
输入:人物肖像图片 | 输出:人物肖像动态视频 |
输入:人物肖像图片 | 输出:人物肖像动态视频 |
“开心”表情的模板序列:("input.driven_id": "mengwa_kaixin") |
声动人像VideoRetalk
基于人物视频和人声音频,生成人物讲话口型与输入音频相匹配的视频。使用时需调用下述模型。VideoRetalk视频生成API详情
模型名称 | 说明 | 单价 | 免费额度 |
模型名称 | 说明 | 单价 | 免费额度 |
videoretalk | 生成人物讲话口型与输入音频相匹配的新视频 | 0.08元/秒 | 1800秒 有效期:百炼开通后180天内 |
视频风格重绘
支持根据用户输入的文字内容,生成符合语义描述的不同风格的视频,或者根据用户输入的视频,进行视频风格重绘。API参考
模型名称 | 说明 | 计费 | 免费额度 |
模型名称 | 说明 | 计费 | 免费额度 |
video-style-transform | 视觉风格重绘 | 限时免费 |
模型效果示例
原始视频(输入) | 日式漫画(输出) |
原始视频(输入) | 日式漫画(输出) |
- 本页导读 (1)
- 模型总览
- 支持的模型
- 文生视频
- 图生视频-基于首帧
- 图生视频-基于首尾帧
- 舞动人像AnimateAnyone
- 悦动人像EMO
- 灵动人像LivePortrait
- 表情包Emoji
- 声动人像VideoRetalk
- 视频风格重绘