重要 本文档仅适用于“中国内地(北京)”地域,且必须使用该地域的API Key。
适用范围
为确保调用成功,请务必保证模型、Endpoint URL 和 API Key 均属于同一地域。跨地域调用将会失败。
HTTP调用
由于首尾帧生视频任务耗时较长(通常为1-5分钟),API采用异步调用。整个流程包含 "创建任务 -> 轮询获取" 两个核心步骤,具体如下:
步骤1:创建任务获取任务ID
北京地域:POST https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis
请求参数 | 首尾帧生视频根据首帧、尾帧和 prompt 生成视频。 curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
-H 'X-DashScope-Async: enable' \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H 'Content-Type: application/json' \
-d '{
"model": "pixverse/pixverse-v5.6-kf2v",
"input": {
"media": [
{
"type": "first_frame",
"url": "https://wanx.alicdn.com/material/20250318/first_frame.png"
},
{
"type": "last_frame",
"url": "https://wanx.alicdn.com/material/20250318/last_frame.png"
}
],
"prompt": "一只小猫从窗台向下跳跃,轻盈地落在沙发上,然后好奇地环顾四周。"
},
"parameters": {
"resolution": "720P",
"duration": 5,
"watermark": false
}
}'
生成带音频视频通过设置 audio 参数为 true,模型将根据视频内容自动生成匹配的背景音乐或音效。 curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
-H 'X-DashScope-Async: enable' \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H 'Content-Type: application/json' \
-d '{
"model": "pixverse/pixverse-v5.6-kf2v",
"input": {
"media": [
{
"type": "first_frame",
"url": "https://wanx.alicdn.com/material/20250318/first_frame.png"
},
{
"type": "last_frame",
"url": "https://wanx.alicdn.com/material/20250318/last_frame.png"
}
],
"prompt": "一只小猫从窗台向下跳跃,轻盈地落在沙发上,然后好奇地环顾四周。"
},
"parameters": {
"resolution": "720P",
"duration": 5,
"audio": true,
"watermark": true
}
}'
|
请求头(Headers) |
Content-Type string (必选) 请求内容类型。此参数必须设置为application/json。 |
Authorization string(必选) 请求身份认证。接口使用阿里云百炼API-Key进行身份认证。示例值:Bearer sk-xxxx。 |
X-DashScope-Async string (必选) 异步处理配置参数。HTTP请求只支持异步,必须设置为enable。
重要 缺少此请求头将报错:“current user api does not support synchronous calls”。 |
请求体(Request Body) |
model string (必选) 模型名称。 固定值:pixverse/pixverse-v5.6-kf2v。 |
input object (必选) 输入的基本信息,包含首帧、尾帧图像和提示词。 属性 prompt string (必选) 文本提示词。用来描述首帧到尾帧之间的变化过程。 支持中英文,每个汉字/字母占一个字符,字符编码为UTF-8,不超过2048个字符,超过部分会自动截断。 如果首尾帧的主体和场景变化较大,建议描写变化过程,例如运镜过程(镜头向左移动)或者主体运动过程(人向前奔跑)。 示例值:一只小猫从窗台向下跳跃,轻盈地落在沙发上,然后好奇地环顾四周。 media array (必选) 媒体资源列表,包含首帧和尾帧图像。 数组必须包含 2 个元素,每个元素为一个媒体对象,包含 type 与 url 字段。 属性 type string (必选) 媒体类型。 first_frame:首帧图像。
last_frame:尾帧图像。
使用限制:每种 type 在 media 数组中只能出现一次。例如,不可同时传入两个 first_frame。 url string (必选) 图像的公网可访问URL。 支持 HTTP 或 HTTPS 协议。 示例值:https://xxx/xxx.png。
图像限制: 格式:JPG、PNG、WEBP。 分辨率:宽度和高度均不超过10000像素。 文件大小:不超过20MB。
|
parameters object (必选) 视频生成参数。如设置视频分辨率、时长、是否生成音频等。 属性 resolution string (必选)
重要 resolution直接影响费用,分辨率越高费用越高,请在调用前确认模型价格。 生成视频的分辨率。 可选值:360P、540P、720P、1080P。 示例值:720P。 duration integer (必选)
重要 duration直接影响费用,按秒计费,时间越长费用越高,请在调用前确认模型价格。 生成视频的时长,单位为秒。 可选值: 示例值:5。 audio boolean (可选)
重要 audio直接影响费用,有声视频 > 无声视频,请在调用前确认模型价格。 是否生成有声视频。开启后模型将根据视频内容自动生成匹配的背景音乐或音效。 false:默认值,输出无声视频。
true:输出有声视频。
示例值:false。 watermark boolean (可选) 是否添加水印标识,水印位于视频右下角,文案固定为“AI生成”。 false:默认值,不添加水印。
true:添加水印。
示例值:false。 seed integer (可选) 随机数种子,取值范围为[0, 2147483647]。 未指定时,系统自动生成随机种子。若需提升生成结果的可复现性,建议固定seed值。 请注意,由于模型生成具有概率性,即使使用相同 seed,也不能保证每次生成结果完全一致。 示例值:12345。 |
响应参数 | 成功响应请保存 task_id,用于查询任务状态与结果。 {
"output": {
"task_status": "PENDING",
"task_id": "0385dc79-5ff8-4d82-bcb6-xxxxxx"
},
"request_id": "4909100c-7b5a-9f92-bfe5-xxxxxx"
}
异常响应创建任务失败,请参见错误信息进行解决。 {
"code": "InvalidApiKey",
"message": "No API-key provided.",
"request_id": "7438d53d-6eb8-4596-8835-xxxxxx"
}
|
output object 任务输出信息。 属性 task_id string 任务ID。查询有效期24小时。 task_status string 任务状态。 枚举值 PENDING:任务排队中 RUNNING:任务处理中 SUCCEEDED:任务执行成功 FAILED:任务执行失败 CANCELED:任务已取消 UNKNOWN:任务不存在或状态未知
|
request_id string 请求唯一标识。可用于请求明细溯源和问题排查。 |
code string 请求失败的错误码。请求成功时不会返回此参数,详情请参见错误信息。 | |
message string 请求失败的详细信息。请求成功时不会返回此参数,详情请参见错误信息。 | |
步骤2:根据任务ID查询结果
北京地域:GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}
说明 轮询建议:视频生成过程约需数分钟,建议采用轮询机制,并设置合理的查询间隔(如 15 秒)来获取结果。
任务状态流转:PENDING(排队中)→ RUNNING(处理中)→ SUCCEEDED(成功)/ FAILED(失败)。
task_id 有效期:24小时,超时后将无法查询结果,接口将返回任务状态为UNKNOWN。
RPS 限制:查询接口默认RPS为20。如需更高频查询或事件通知,建议配置异步任务回调。
更多操作:如需批量查询、取消任务等操作,请参见管理异步任务。
请求参数 | 查询任务结果将{task_id}完整替换为上一步接口返回的task_id的值。task_id查询有效期为24小时。 curl -X GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id} \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"
|
请求头(Headers) |
Authorization string(必选) 请求身份认证。接口使用阿里云百炼API-Key进行身份认证。示例值:Bearer sk-xxxx。 |
URL路径参数(Path parameters) |
|
响应参数 | 任务执行成功{
"request_id": "40799260-689c-4c44-9d7c-xxxxxx",
"output": {
"task_id": "408b6c3b-27c9-43dd-b928-xxxxxx",
"task_status": "SUCCEEDED",
"submit_time": "2026-03-20 13:47:42.916",
"scheduled_time": "2026-03-20 13:47:42.949",
"end_time": "2026-03-20 13:48:41.896",
"orig_prompt": "一只小猫从窗台向下跳跃,轻盈地落在沙发上,然后好奇地环顾四周。",
"video_url": "https://media.pixverseai.cn/xxx.mp4"
},
"usage": {
"duration": 5,
"size": "1280*960",
"fps": 24,
"video_count": 1,
"audio": false,
"SR": "720"
}
}
任务执行失败若任务执行失败,task_status将置为 FAILED,并提供错误码和信息。请参见错误信息进行解决。 {
"request_id": "e5d70b02-ebd3-98ce-9fe8-759d7d7b107d",
"output": {
"task_id": "86ecf553-d340-4e21-af6e-a0c6a421c010",
"task_status": "FAILED",
"code": "InvalidParameter",
"message": "The size is not match xxxxxx"
}
}
任务查询过期task_id查询有效期为 24 小时,超时后将无法查询,返回以下报错信息。 {
"request_id": "a4de7c32-7057-9f82-8581-xxxxxx",
"output": {
"task_id": "502a00b1-19d9-4839-a82f-xxxxxx",
"task_status": "UNKNOWN"
}
}
|
output object 任务输出信息。 属性 task_id string 任务ID。查询有效期24小时。 task_status string 任务状态。 枚举值 PENDING:任务排队中 RUNNING:任务处理中 SUCCEEDED:任务执行成功 FAILED:任务执行失败 CANCELED:任务已取消 UNKNOWN:任务不存在或状态未知
轮询过程中的状态流转: PENDING(排队中) → RUNNING(处理中)→ SUCCEEDED(成功)/ FAILED(失败)。 初次查询状态通常为 PENDING(排队中)或 RUNNING(处理中)。 当状态变为 SUCCEEDED 时,响应中将包含生成的视频url。 若状态为 FAILED,请检查错误信息并重试。
submit_time string 任务提交时间。格式为 YYYY-MM-DD HH:mm:ss.SSS。 scheduled_time string 任务执行时间。格式为 YYYY-MM-DD HH:mm:ss.SSS。 end_time string 任务完成时间。格式为 YYYY-MM-DD HH:mm:ss.SSS。 video_url string 视频URL。仅在 task_status 为 SUCCEEDED 时返回。 视频格式为MP4(H.264 编码)。视频链接暂无过期时间,但不建议将其作为长期存储,请及时下载。 orig_prompt string 原始输入的prompt,对应请求参数prompt。 code string 请求失败的错误码。请求成功时不会返回此参数,详情请参见错误信息。 message string 请求失败的详细信息。请求成功时不会返回此参数,详情请参见错误信息。 |
usage object 输出信息统计。只对成功的结果计数。 属性 duration integer 生成视频的总视频时长,用于计费。 size string 生成视频的分辨率。示例值:1280*720。 fps integer 生成视频的帧率。示例值:24。 SR string 生成视频的分辨率档位。示例值:720。 audio boolean 生成视频是否为有声视频。示例值:false。 video_count integer 生成视频的数量。固定为1。 | |
request_id string 请求唯一标识。可用于请求明细溯源和问题排查。 | |
错误码
如果模型调用失败并返回报错信息,请参见错误信息进行解决。
常见问题
Q: media数组中首帧和尾帧的顺序是否有要求?
A: media数组中需要包含两个对象,分别设置type为first_frame(首帧)和last_frame(尾帧),顺序不影响结果,系统会根据type字段自动识别。
Q: 为什么1080P分辨率下不能使用10秒时长?
A: 1080P分辨率下仅支持5秒和8秒时长。这是模型本身的限制。如果需要生成10秒视频,请选择720P或更低的分辨率档位。
Q: 首帧和尾帧图像的分辨率是否需要一致?
A: 不需要。首帧和尾帧图像的分辨率可以不同,系统会自动处理。
输出视频的宽高比将以首帧图像为基准(近似),分辨率将根据所选 size 档位(如 720P)自动适配至相近总像素。