07-视频模型指南
视频模型指南
本文档介绍悠船 API 视频生成模型的完整使用指南,包括支持的接口、参数、高级控制、限制规则及最佳实践。
模型概述
悠船视频模型可将静态图像转化为 5 秒动态视频序列,以单张图片作为首帧,配合可选的文字提示生成连贯的视频内容。
核心特性:
图生视频:以已有图像为视频起始帧,确保画面风格和内容可控
文本提示可选:可搭配文字描述引导视频中的动作和变化方向
速度模式限制:目前仅支持快速模式(
--fast),不支持慢速和极速模式视频延长:通过视频延长接口可对生成的视频进行延长,每次增加 4 秒,最多延长 4 次(总计 21 秒)
视频高清:通过视频高清接口可生成 1080P 高清视频
支持的接口
接口 | 方法 | 路径 | 说明 |
图生视频 | POST |
| 将图像转化为 5 秒视频 |
视频延长 | POST |
| 对已有视频延长 4 秒,最多 4 次 |
视频高清 | POST |
| 生成 1080P 高清视频 |
使用方法
指定首帧图片
视频生成需要指定首帧图片,有以下两种方式:
方式一:使用悠船生成的图像
通过传入 jobId 和 imageNo 指定视频的首帧。适用于先用图像生成接口创建图片,再将其转化为视频的工作流。
方式二:使用自定义图像
在 prompt 字段中通过图片 URL 指定视频首帧:
import requests
url = "https://ali.youchuan.cn/v1/tob/video-diffusion"
headers = {
"x-youchuan-app": "YOUR_APP_ID",
"x-youchuan-secret": "YOUR_SECRET_KEY"
}
# 方式一:基于已有图像生成视频
data_with_image = {
"jobId": "existing_job_id",
"imageNo": 0,
"prompt": "Make this image move with gentle animation",
"callback": "https://your-callback-url.com"
}
response = requests.post(url, headers=headers, json=data_with_image)
print(response.json())
# 方式二:文本生成视频
data = {
"prompt": "A beautiful sunset over the ocean with gentle waves",
"callback": "https://your-callback-url.com"
}
response = requests.post(url, headers=headers, json=data)
print(response.json())
文本提示词
文本提示词为可选项,但以下情况必须提供文本提示词:
使用
--raw参数时,文本提示词不能为空
视频规格
分辨率与画质
悠船支持 480p 和 720p 两种视频规格:
480p(默认):标准画质,费用系数 4.0
720p:高清画质,费用系数 12.0(为 480p 的 3 倍)
视频尺寸
480p 视频尺寸基于原始图像比例自动适配:
原图比例 | 视频比例 | 分辨率示例 |
1:1 | 1:1 | 624×624 |
4:3 | 77:58 | 720×544 |
2:3 | 2:3 | 512×768 |
16:9 | 91:51 | 832×464 |
1:2 | 1:2 | 448×880 |
完整参数表
以下参数通过图生视频接口和视频延长接口的 prompt 字段传入。
参数 | 说明 | 取值/选项 | 默认值 |
| 批次数量,一次任务生成的视频数 | 1, 2, 4 | 4 |
| 动态模式,控制视频动作幅度 |
|
|
| 原始模式,减少系统自动修饰 | 开关参数 | 关闭 |
| 尾帧指定,指定视频结束帧画面 | 图片 URL | 无 |
| 视频循环,生成首尾一致的可循环视频 | 开关参数 | 关闭 |
| 快速模式(默认速度模式) | 开关参数 | 开启 |
批次数量费用系数
参数值 | 生成视频数 | 费用系数 | 说明 |
1 | 1 个 | 0.25 | 一次任务生成 1 个视频 |
2 | 2 个 | 0.5 | 一次任务生成 2 个视频 |
4 | 4 个 | 1.0 | 一次任务生成 4 个视频(默认) |
高级控制
运动强度(--motion)
控制视频中画面元素的动作幅度:
--motion low(默认):适合静态场景和细微动作,如人物微表情、树叶轻摇--motion high:大幅镜头运动和画面变化,可能产生更具艺术感的效果
Raw 模式(--raw)
使用 --raw 参数可减少系统自动修饰,获得更精准的效果控制。
注意:使用 --raw 时,文本提示词不能为空。
尾帧指定(--end)
通过 --end [图片URL] 指定视频的尾帧画面,用于控制视频的结束状态。
视频循环(--loop)
使用 --loop 参数生成首尾帧一致的无缝可循环视频。
注意:--loop 不支持与 --end 同时使用。
视频延长
使用视频延长接口对生成的视频进行延长:
每次延长增加 4 秒 时长
最多可延长 4 次(即最终 21 秒视频)
视频高清
使用视频高清接口生成 1080P 分辨率的高清视频。
计费说明
视频任务的单条费用计算公式:单价 × 任务系数 × 速度系数。
任务系数
视频规格 | 任务系数 |
图生视频 480p | 4.0 |
图生视频 720p | 12.0 |
批次数量系数
| 费用系数 |
1 | 0.25 |
2 | 0.5 |
4(默认) | 1.0 |
示例:生成一个 480p 视频(--bs 4)的费用为:0.6 × 4.0 × 1.0 = 2.4 元。
限制与验证规则
# | 限制规则 | 说明 |
1 | 速度模式限制 | 仅支持快速模式( |
2 | 尾帧与循环互斥 |
|
3 | Raw 模式文本要求 | 使用 |
4 | 视频延长上限 | 最多延长 4 次(总计 21 秒) |
5 | 视频高清规格 | 视频高清接口仅支持生成 1080P |
6 | 首帧来源限制 | 首帧必须来自悠船图像生成结果或有效的图片 URL |
7 | 不支持种子参数 | 极速模式( |
8 | 内容审核 | 所有生成内容会经过合规审核,违规内容可能被拒绝 |
最佳实践
先用图生图,再转视频:建议先用图像生成接口创建满意的静态图像,再通过视频接口将其动态化,这样对画面内容的控制更精确。
静态场景用低运动:对于风景、人物肖像等静态内容,使用
--motion low能获得更自然的细微动态效果。艺术效果用高运动:需要抽象或梦幻效果时尝试
--motion high,可能产生意想不到的艺术化画面。循环视频用
--loop:制作背景动效、加载动画等需要无缝循环的内容时,使用--loop参数。精准控制用 Raw 模式:当需要减少系统自动美化、更忠实于提示词时,搭配
--raw使用并确保提供文本提示。控制成本用
--bs 1:测试阶段建议设置--bs 1(费用系数 0.25),效果满意后再批量生成。