07-视频模型指南

更新时间:
复制为 MD 格式

视频模型指南

本文档介绍悠船 API 视频生成模型的完整使用指南,包括支持的接口、参数、高级控制、限制规则及最佳实践。

模型概述

悠船视频模型可将静态图像转化为 5 秒动态视频序列,以单张图片作为首帧,配合可选的文字提示生成连贯的视频内容。

核心特性:

  • 图生视频:以已有图像为视频起始帧,确保画面风格和内容可控

  • 文本提示可选:可搭配文字描述引导视频中的动作和变化方向

  • 速度模式限制:目前仅支持快速模式(--fast),不支持慢速和极速模式

  • 视频延长:通过视频延长接口可对生成的视频进行延长,每次增加 4 秒,最多延长 4 次(总计 21 秒)

  • 视频高清:通过视频高清接口可生成 1080P 高清视频

支持的接口

接口

方法

路径

说明

图生视频

POST

/v1/tob/video

将图像转化为 5 秒视频

视频延长

POST

/v1/tob/video/extend

对已有视频延长 4 秒,最多 4 次

视频高清

POST

/v1/tob/video/upscale

生成 1080P 高清视频

使用方法

指定首帧图片

视频生成需要指定首帧图片,有以下两种方式:

方式一:使用悠船生成的图像

通过传入 jobIdimageNo 指定视频的首帧。适用于先用图像生成接口创建图片,再将其转化为视频的工作流。

方式二:使用自定义图像

prompt 字段中通过图片 URL 指定视频首帧:

import requests

url = "https://ali.youchuan.cn/v1/tob/video-diffusion"
headers = {
    "x-youchuan-app": "YOUR_APP_ID",
    "x-youchuan-secret": "YOUR_SECRET_KEY"
}

# 方式一:基于已有图像生成视频
data_with_image = {
    "jobId": "existing_job_id",
    "imageNo": 0,
    "prompt": "Make this image move with gentle animation",
    "callback": "https://your-callback-url.com"
}

response = requests.post(url, headers=headers, json=data_with_image)
print(response.json())

# 方式二:文本生成视频
data = {
    "prompt": "A beautiful sunset over the ocean with gentle waves",
    "callback": "https://your-callback-url.com"
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

文本提示词

文本提示词为可选项,但以下情况必须提供文本提示词:

  • 使用 --raw 参数时,文本提示词不能为空

视频规格

分辨率与画质

悠船支持 480p720p 两种视频规格:

  • 480p(默认):标准画质,费用系数 4.0

  • 720p:高清画质,费用系数 12.0(为 480p 的 3 倍)

视频尺寸

480p 视频尺寸基于原始图像比例自动适配:

原图比例

视频比例

分辨率示例

1:1

1:1

624×624

4:3

77:58

720×544

2:3

2:3

512×768

16:9

91:51

832×464

1:2

1:2

448×880

完整参数表

以下参数通过图生视频接口和视频延长接口的 prompt 字段传入。

参数

说明

取值/选项

默认值

--bs--batchsize

批次数量,一次任务生成的视频数

1, 2, 4

4

--motion

动态模式,控制视频动作幅度

low, high

low

--raw

原始模式,减少系统自动修饰

开关参数

关闭

--end [URL]

尾帧指定,指定视频结束帧画面

图片 URL

--loop

视频循环,生成首尾一致的可循环视频

开关参数

关闭

--fast

快速模式(默认速度模式)

开关参数

开启

批次数量费用系数

参数值

生成视频数

费用系数

说明

1

1 个

0.25

一次任务生成 1 个视频

2

2 个

0.5

一次任务生成 2 个视频

4

4 个

1.0

一次任务生成 4 个视频(默认)

高级控制

运动强度(--motion

控制视频中画面元素的动作幅度:

  • --motion low(默认):适合静态场景和细微动作,如人物微表情、树叶轻摇

  • --motion high:大幅镜头运动和画面变化,可能产生更具艺术感的效果

Raw 模式(--raw

使用 --raw 参数可减少系统自动修饰,获得更精准的效果控制。

注意:使用 --raw 时,文本提示词不能为空。

尾帧指定(--end

通过 --end [图片URL] 指定视频的尾帧画面,用于控制视频的结束状态。

视频循环(--loop

使用 --loop 参数生成首尾帧一致的无缝可循环视频。

注意--loop 不支持与 --end 同时使用。

视频延长

使用视频延长接口对生成的视频进行延长:

  • 每次延长增加 4 秒 时长

  • 最多可延长 4 次(即最终 21 秒视频)

视频高清

使用视频高清接口生成 1080P 分辨率的高清视频。

计费说明

视频任务的单条费用计算公式:单价 × 任务系数 × 速度系数

任务系数

视频规格

任务系数

图生视频 480p

4.0

图生视频 720p

12.0

批次数量系数

--bs

费用系数

1

0.25

2

0.5

4(默认)

1.0

示例:生成一个 480p 视频(--bs 4)的费用为:0.6 × 4.0 × 1.0 = 2.4 元

限制与验证规则

#

限制规则

说明

1

速度模式限制

仅支持快速模式(--fast),不支持 --relax--turbo

2

尾帧与循环互斥

--loop--end 不可同时使用

3

Raw 模式文本要求

使用 --raw 时,文本提示词不能为空

4

视频延长上限

最多延长 4 次(总计 21 秒)

5

视频高清规格

视频高清接口仅支持生成 1080P

6

首帧来源限制

首帧必须来自悠船图像生成结果或有效的图片 URL

7

不支持种子参数

极速模式(--turbo)本身不支持 --seed,且视频任务也不支持极速模式

8

内容审核

所有生成内容会经过合规审核,违规内容可能被拒绝

最佳实践

  1. 先用图生图,再转视频:建议先用图像生成接口创建满意的静态图像,再通过视频接口将其动态化,这样对画面内容的控制更精确。

  2. 静态场景用低运动:对于风景、人物肖像等静态内容,使用 --motion low 能获得更自然的细微动态效果。

  3. 艺术效果用高运动:需要抽象或梦幻效果时尝试 --motion high,可能产生意想不到的艺术化画面。

  4. 循环视频用 --loop:制作背景动效、加载动画等需要无缝循环的内容时,使用 --loop 参数。

  5. 精准控制用 Raw 模式:当需要减少系统自动美化、更忠实于提示词时,搭配 --raw 使用并确保提供文本提示。

  6. 控制成本用 --bs 1:测试阶段建议设置 --bs 1(费用系数 0.25),效果满意后再批量生成。