07-视频模型指南-云市场(Marketplace)-阿里云帮助中心

视频模型指南

本文档介绍悠船 API 视频生成模型的完整使用指南，包括支持的接口、参数、高级控制、限制规则及最佳实践。

模型概述

悠船视频模型可将静态图像转化为 5 秒动态视频序列，以单张图片作为首帧，配合可选的文字提示生成连贯的视频内容。

核心特性：

图生视频：以已有图像为视频起始帧，确保画面风格和内容可控
文本提示可选：可搭配文字描述引导视频中的动作和变化方向
速度模式限制：目前仅支持快速模式（--fast），不支持慢速和极速模式
视频延长：通过视频延长接口可对生成的视频进行延长，每次增加 4 秒，最多延长 4 次（总计 21 秒）
视频高清：通过视频高清接口可生成 1080P 高清视频

支持的接口

接口	方法	路径	说明
图生视频	POST	`/v1/tob/video`	将图像转化为 5 秒视频
视频延长	POST	`/v1/tob/video/extend`	对已有视频延长 4 秒，最多 4 次
视频高清	POST	`/v1/tob/video/upscale`	生成 1080P 高清视频

使用方法

指定首帧图片

视频生成需要指定首帧图片，有以下两种方式：

方式一：使用悠船生成的图像

通过传入 jobId 和 imageNo 指定视频的首帧。适用于先用图像生成接口创建图片，再将其转化为视频的工作流。

方式二：使用自定义图像

在 prompt 字段中通过图片 URL 指定视频首帧：

import requests

url = "https://ali.youchuan.cn/v1/tob/video-diffusion"
headers = {
    "x-youchuan-app": "YOUR_APP_ID",
    "x-youchuan-secret": "YOUR_SECRET_KEY"
}

# 方式一：基于已有图像生成视频
data_with_image = {
    "jobId": "existing_job_id",
    "imageNo": 0,
    "prompt": "Make this image move with gentle animation",
    "callback": "https://your-callback-url.com"
}

response = requests.post(url, headers=headers, json=data_with_image)
print(response.json())

# 方式二：文本生成视频
data = {
    "prompt": "A beautiful sunset over the ocean with gentle waves",
    "callback": "https://your-callback-url.com"
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

文本提示词

文本提示词为可选项，但以下情况必须提供文本提示词：

使用 --raw 参数时，文本提示词不能为空

视频规格

分辨率与画质

悠船支持 480p 和 720p 两种视频规格：

480p（默认）：标准画质，费用系数 4.0
720p：高清画质，费用系数 12.0（为 480p 的 3 倍）

视频尺寸

480p 视频尺寸基于原始图像比例自动适配：

原图比例	视频比例	分辨率示例
1:1	1:1	624×624
4:3	77:58	720×544
2:3	2:3	512×768
16:9	91:51	832×464
1:2	1:2	448×880

完整参数表

以下参数通过图生视频接口和视频延长接口的 prompt 字段传入。

参数	说明	取值/选项	默认值
`--bs` 或 `--batchsize`	批次数量，一次任务生成的视频数	1, 2, 4	4
`--motion`	动态模式，控制视频动作幅度	`low`, `high`	`low`
`--raw`	原始模式，减少系统自动修饰	开关参数	关闭
`--end [URL]`	尾帧指定，指定视频结束帧画面	图片 URL	无
`--loop`	视频循环，生成首尾一致的可循环视频	开关参数	关闭
`--fast`	快速模式（默认速度模式）	开关参数	开启

批次数量费用系数

参数值	生成视频数	费用系数	说明
1	1 个	0.25	一次任务生成 1 个视频
2	2 个	0.5	一次任务生成 2 个视频
4	4 个	1.0	一次任务生成 4 个视频（默认）

高级控制

运动强度（`--motion`）

控制视频中画面元素的动作幅度：

--motion low（默认）：适合静态场景和细微动作，如人物微表情、树叶轻摇
--motion high：大幅镜头运动和画面变化，可能产生更具艺术感的效果

Raw 模式（`--raw`）

使用 --raw 参数可减少系统自动修饰，获得更精准的效果控制。

注意：使用 --raw 时，文本提示词不能为空。

尾帧指定（`--end`）

通过 --end [图片URL] 指定视频的尾帧画面，用于控制视频的结束状态。

视频循环（`--loop`）

使用 --loop 参数生成首尾帧一致的无缝可循环视频。

注意：--loop 不支持与 --end 同时使用。

视频延长

使用视频延长接口对生成的视频进行延长：

每次延长增加 4 秒 时长
最多可延长 4 次（即最终 21 秒视频）

视频高清

使用视频高清接口生成 1080P 分辨率的高清视频。

计费说明

视频任务的单条费用计算公式：单价 × 任务系数 × 速度系数。

任务系数

视频规格	任务系数
图生视频 480p	4.0
图生视频 720p	12.0

批次数量系数

`--bs` 值	费用系数
1	0.25
2	0.5
4（默认）	1.0

示例：生成一个 480p 视频（--bs 4）的费用为：0.6 × 4.0 × 1.0 = 2.4 元。

限制与验证规则

#	限制规则	说明
1	速度模式限制	仅支持快速模式（`--fast`），不支持 `--relax` 和 `--turbo`
2	尾帧与循环互斥	`--loop` 与 `--end` 不可同时使用
3	Raw 模式文本要求	使用 `--raw` 时，文本提示词不能为空
4	视频延长上限	最多延长 4 次（总计 21 秒）
5	视频高清规格	视频高清接口仅支持生成 1080P
6	首帧来源限制	首帧必须来自悠船图像生成结果或有效的图片 URL
7	不支持种子参数	极速模式（`--turbo`）本身不支持 `--seed`，且视频任务也不支持极速模式
8	内容审核	所有生成内容会经过合规审核，违规内容可能被拒绝

最佳实践

先用图生图，再转视频：建议先用图像生成接口创建满意的静态图像，再通过视频接口将其动态化，这样对画面内容的控制更精确。
静态场景用低运动：对于风景、人物肖像等静态内容，使用 --motion low 能获得更自然的细微动态效果。
艺术效果用高运动：需要抽象或梦幻效果时尝试 --motion high，可能产生意想不到的艺术化画面。
循环视频用 --loop：制作背景动效、加载动画等需要无缝循环的内容时，使用 --loop 参数。
精准控制用 Raw 模式：当需要减少系统自动美化、更忠实于提示词时，搭配 --raw 使用并确保提供文本提示。
控制成本用 --bs 1：测试阶段建议设置 --bs 1（费用系数 0.25），效果满意后再批量生成。