通义万相-图生视频API参考

通义万相-图生视频模型根据首帧图像文本提示词,生成一段流畅的视频。支持的能力包括:

  • 基础能力:时长灵活(3-10秒)、指定视频分辨率、智能改写prompt、添加水印。

  • 音频能力:支持自动配音,或传入自定义音频文件,实现音画同步。(仅wan2.5支持)

  • 视频特效:部分模型内置“魔法悬浮”、“气球膨胀”等特效模板,可直接调用。

快速入口:通义万相官网在线体验 视频特效列表

说明

通义万相官网的功能与API支持的能力可能存在差异,具体以API文档中列出的能力为准。如有新增功能,API文档会及时更新,敬请关注。

模型概览

输入首帧图像和音频

输出视频(wan2.5)

rap-转换自-png

输入音频

输入提示词:一幅都市奇幻艺术的场景。一个充满动感的涂鸦艺术角色。一个由喷漆所画成的少年,正从一面混凝土墙上活过来。他一边用极快的语速演唱一首英文rap,一边摆着一个经典的、充满活力的说唱歌手姿势。场景设定在夜晚一个充满都市感的铁路桥下。灯光来自一盏孤零零的街灯,营造出电影般的氛围,充满高能量和惊人的细节。视频的音频部分完全由少年的rap构成,没有其他对话或杂音。

模型名称(model)

模型简介

输出视频规格

wan2.5-i2v-preview 推荐

万相2.5 preview(有声视频)

新增音频能力:支持自动配音,或传入自定义音频文件

分辨率档位:480P、720P、1080P

视频时长:5秒,10

固定规格:24fps、MP4 (H.264编码) 

wan2.2-i2v-flash

万相2.2极速版(无声视频)

2.1模型速度提升50%

分辨率档位:480P、720P、1080P

视频时长:5

固定规格:30fps、MP4 (H.264编码) 

wan2.2-i2v-plus

万相2.2专业版(无声视频)

2.1模型稳定性与成功率全面提升

分辨率档位:480P、1080P

视频时长:5

固定规格:30fps、MP4 (H.264编码) 

wanx2.1-i2v-plus

万相2.1专业版(无声视频)

分辨率档位:720P

视频时长:5

固定规格:30fps、MP4 (H.264编码) 

wanx2.1-i2v-turbo

万相2.1极速版(无声视频)

分辨率档位:480P、720P

视频时长:3、4、5

固定规格:30fps、MP4 (H.264编码) 

说明

调用前,请查阅各地域支持的模型列表与价格

前提条件

在调用前,先获取API Key,再配置API Key到环境变量。如需通过SDK进行调用,请安装DashScope SDK

重要

北京和新加坡地域拥有独立的 API Key 请求地址,不可混用,跨地域调用将导致鉴权失败或服务报错。

HTTP调用

由于图生视频任务耗时较长(通常为1-5分钟),API采用异步调用。整个流程包含 “创建任务 -> 轮询获取” 两个核心步骤,具体如下:

具体耗时受限于排队任务数和服务执行情况,请在获取结果时耐心等待。

步骤1:创建任务获取任务ID

北京地域POST https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

新加坡地域POST https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis

说明
  • 创建成功后,使用接口返回的 task_id 查询结果,task_id 有效期为 24 小时。请勿重复创建任务,轮询获取即可。

  • 新手指引请参见Postman

请求参数

自动配音

仅 wan2.5-i2v-preview 支持。模型已默认开启自动配音功能,无需配置;如需显式声明,可将 parameters.audio 参数设置为 true 。

curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
    -H 'X-DashScope-Async: enable' \
    -H "Authorization: Bearer $DASHSCOPE_API_KEY" \
    -H 'Content-Type: application/json' \
    -d '{
    "model": "wan2.5-i2v-preview",
    "input": {
        "prompt": "一幅都市奇幻艺术的场景。一个充满动感的涂鸦艺术角色。一个由喷漆所画成的少年,正从一面混凝土墙上活过来。他一边用极快的语速演唱一首英文rap,一边摆着一个经典的、充满活力的说唱歌手姿势。场景设定在夜晚一个充满都市感的铁路桥下。灯光来自一盏孤零零的街灯,营造出电影般的氛围,充满高能量和惊人的细节。视频的音频部分完全由少年的rap构成,没有其他对话或杂音。",
        "img_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/wpimhv/rap.png"
    },
    "parameters": {
        "resolution": "480P",
        "prompt_extend": true,
        "duration": 10,
        "audio": true
    }
}'

传入音频文件

wan2.5-i2v-preview支持。请通过 input.audio_url 参数传入音频链接。

curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
    -H 'X-DashScope-Async: enable' \
    -H "Authorization: Bearer $DASHSCOPE_API_KEY" \
    -H 'Content-Type: application/json' \
    -d '{
    "model": "wan2.5-i2v-preview",
    "input": {
        "prompt": "一幅都市奇幻艺术的场景。一个充满动感的涂鸦艺术角色。一个由喷漆所画成的少年,正从一面混凝土墙上活过来。他一边用极快的语速演唱一首英文rap,一边摆着一个经典的、充满活力的说唱歌手姿势。场景设定在夜晚一个充满都市感的铁路桥下。灯光来自一盏孤零零的街灯,营造出电影般的氛围,充满高能量和惊人的细节。视频的音频部分完全由少年的rap构成,没有其他对话或杂音。",
        "img_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/wpimhv/rap.png",
        "audio_url": "https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/ozwpvi/rap.mp3"
    },
    "parameters": {
        "resolution": "480P",
        "prompt_extend": true,
        "duration": 10
    }
}'

生成无声视频

生成无声视频因模型版本而异:

  • 对于 wan2.5-i2v-preview 模型:必须显式地将 parameters.audio 参数设置为 false

  • 对于 wan2.2 及以下版本:模型默认生成无声视频,无需设置任何参数,参考下述代码。

curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
    -H 'X-DashScope-Async: enable' \
    -H "Authorization: Bearer $DASHSCOPE_API_KEY" \
    -H 'Content-Type: application/json' \
    -d '{
    "model": "wan2.2-i2v-plus",
    "input": {
        "prompt": "一只猫在草地上奔跑",
        "img_url": "https://cdn.translate.alibaba.com/r/wanx-demo-1.png"
    },
    "parameters": {
        "resolution": "1080P",
        "prompt_extend": true
    }
}'

使用Base64

img_url 参数支持传入图像的 Base64 编码字符串。先下载img_base64文件,并将完整内容粘贴至img_url参数中。

格式参见输入图像

curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
    -H 'X-DashScope-Async: enable' \
    -H "Authorization: Bearer $DASHSCOPE_API_KEY" \
    -H 'Content-Type: application/json' \
    -d '{
    "model": "wan2.2-i2v-plus",
    "input": {
        "prompt": "一只猫在草地上奔跑",
        "img_url": "......"
    },
    "parameters": {
        "resolution": "1080P",
        "prompt_extend": true
    }
}'

使用视频特效

  • prompt 字段将被忽略,建议留空。

  • 特效的可用性与模型相关。调用前请查阅视频特效列表,以免调用失败。

curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
    -H 'X-DashScope-Async: enable' \
    -H "Authorization: Bearer $DASHSCOPE_API_KEY" \
    -H 'Content-Type: application/json' \
    -d '{
    "model": "wanx2.1-i2v-turbo",
    "input": {
        "img_url": "https://cdn.translate.alibaba.com/r/wanx-demo-1.png",
        "template": "flying"
    },
    "parameters": {
        "resolution": "720P"
    }
}'

使用反向提示词

通过 negative_prompt 指定生成的视频避免出现“花朵”元素。

curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
    -H 'X-DashScope-Async: enable' \
    -H "Authorization: Bearer $DASHSCOPE_API_KEY" \
    -H 'Content-Type: application/json' \
    -d '{
    "model": "wanx2.1-i2v-turbo",
    "input": {
        "prompt": "一只猫在草地上奔跑",
        "negative_prompt": "花朵",
        "img_url": "https://cdn.translate.alibaba.com/r/wanx-demo-1.png"
    },
    "parameters": {
        "resolution": "720P",
        "prompt_extend": true
    }
}'
请求头(Headers)

Content-Type string (必选)

请求内容类型。此参数必须设置为application/json

Authorization string(必选)

请求身份认证。接口使用阿里云百炼API-Key进行身份认证。示例值:Bearer sk-xxxx。

X-DashScope-Async string (必选)

异步处理配置参数。HTTP请求只支持异步,必须设置为enable

重要

缺少此请求头将报错:“current user api does not support synchronous calls”。

请求体(Request Body)

model string (必选)

模型名称。示例值:wan2.2-i2v-plus。

模型列表与价格详见模型价格

input object (必选)

输入的基本信息,如提示词等。

属性

prompt string (可选)

本提示词。用来描述生成图像中期望包含的元素和视觉特点。

支持中英文,每个汉字/字母占一个字符,超过部分会自动截断。长度限制因模型版本而异:

  • wan2.5-i2v-preview:长度不超过2000个字符。

  • wan2.2及以下版本模型:长度不超过800个字符。

当使用视频特效参数(即template不为空)时,prompt参数无效,无需填写。

示例值:一只小猫在草地上奔跑。

提示词使用技巧详见文生视频/图生视频Prompt指南

negative_prompt string (可选)

反向提示词,用来描述不希望在视频画面中看到的内容,可以对视频画面进行限制。

支持中英文,长度不超过500个字符,超过部分会自动截断。

示例值:低分辨率、错误、最差质量、低质量、残缺、多余的手指、比例不良等。

img_url string (必选)

首帧图像的URL或 Base64 编码数据。

图像限制:

  • 图像格式:JPEG、JPG、PNG(不支持透明通道)、BMP、WEBP。

  • 图像分辨率:图像的宽度和高度范围为[360, 2000],单位为像素。

  • 文件大小:不超过10MB。

输入图像说明:

  1. 使用公网可访问URL

    • 支持 HTTP 或 HTTPS 协议。本地文件可通过上传文件获取临时URL

    • 示例值:https://cdn.translate.alibaba.com/r/wanx-demo-1.png

  2. 传入 Base64 编码图像后的字符串

    • 数据格式:data:{MIME_type};base64,{base64_data}

    • 示例值:......。(编码字符串过长,仅展示片段)

    • 具体参见输入图像

audio_url string (可选)

仅 wan2.5-i2v-preview 支持。音频文件的 URL,模型将使用该音频生成视频。使用方式参见音频设置

支持 HTTP 或 HTTPS 协议。本地文件可通过上传文件获取临时URL

音频限制:

  • 格式:wav、mp3。

  • 时长:3~30s。

  • 文件大小:不超过15MB。

  • 超限处理:若音频长度超过 duration 值(5秒或10秒),自动截取前5秒或10秒,其余部分丢弃。若音频长度不足视频时长,超出音频长度部分为无声视频。例如,音频为3秒,视频时长为5秒,输出视频前3秒有声,后2秒无声。

示例值:https://help-static-aliyun-doc.aliyuncs.com/file-manage-files/zh-CN/20250925/ozwpvi/rap.mp3。

template string (可选)

视频特效模板的名称。若未填写,表示不使用任何视频特效。

不同模型支持不同的特效模板。调用前请查阅视频特效列表,以免调用失败。

示例值:flying,表示使用“魔法悬浮”特效。

parameters object (可选)

视频处理参数,如设置视频分辨率、设置视频时长、开启prompt智能改写、添加水印等。

属性

resolution string (可选)

重要

resolution直接影响费用,同一模型:1080P > 720P > 480P,请在调用前确认模型价格

用于指定生成的视频分辨率档位。仅用于调整视频的清晰度(总像素),不改变视频的宽高比,视频宽高比将与输入图像 img_url 的宽高比保持一致

此参数的默认值和可用枚举值依赖于 model 参数,规则如下:

  • wan2.5-i2v-preview :可选值:480P、720P、1080P。默认值为1080P

  • wan2.2-i2v-flash:可选值:480P、720P、1080P。默认值为720P

  • wan2.2-i2v-plus:可选值:480P、1080P。默认值为1080P

  • wanx2.1-i2v-turbo:可选值:480P、720P。默认值为720P

  • wanx2.1-i2v-plus:可选值:720P。默认值为720P

示例值:1080P。

duration integer (可选)

重要

duration直接影响费用,按秒计费,时间越长费用越高,请在调用前确认模型价格

生成视频的时长,单位为秒。该参数的取值依赖于 model参数:

  • wan2.5-i2v-preview:可选值为5、10。默认值为5。

  • wan2.2-i2v-plus:固定为5秒,且不支持修改。

  • wan2.2-i2v-flash:固定为5秒,且不支持修改。

  • wanx2.1-i2v-plus:固定为5秒,且不支持修改。

  • wanx2.1-i2v-turbo:可选值为3、45。默认值为5。

示例值:5。

prompt_extend boolean (可选)

是否开启prompt智能改写。开启后使用大模型对输入prompt进行智能改写。对于较短的prompt生成效果提升明显,但会增加耗时。

  • true:默认值,开启智能改写。

  • false:不开启智能改写。

示例值:true。

watermark boolean (可选)

是否添加水印标识,水印位于视频右下角,文案固定为“AI生成”。

  • false:默认值,不添加水印。

  • true:添加水印。

示例值:false。

audio boolean (可选)

仅 wan2.5-i2v-preview 支持。 用于控制是否添加音频。

参数优先级:audio_url > audio,仅在 audio_url为空时生效。使用方式参见音频设置

  • true:默认值,自动为视频添加音频。

  • false:不添加音频,输出无声视频。

示例值:true。

seed integer (可选)

随机数种子,取值范围为[0, 2147483647]

未指定时,系统自动生成随机种子。若需提升生成结果的可复现性,建议固定seed值。

请注意,由于模型生成具有概率性,即使使用相同 seed,也不能保证每次生成结果完全一致。

示例值:12345。

响应参数

成功响应

请保存 task_id,用于查询任务状态与结果。

{
    "output": {
        "task_status": "PENDING",
        "task_id": "0385dc79-5ff8-4d82-bcb6-xxxxxx"
    },
    "request_id": "4909100c-7b5a-9f92-bfe5-xxxxxx"
}

异常响应

创建任务失败,请参见错误信息进行解决。

{
    "code":"InvalidApiKey",
    "message":"Invalid API-key provided.",
    "request_id":"fb53c4ec-1c12-4fc4-a580-xxxxxx"
}

output object

任务输出信息。

属性

task_id string

任务ID。查询有效期24小时。

task_status string

任务状态。

枚举值

  • PENDING:任务排队中

  • RUNNING:任务处理中

  • SUCCEEDED:任务执行成功

  • FAILED:任务执行失败

  • CANCELED:任务已取消

  • UNKNOWN:任务不存在或状态未知

request_id string

请求唯一标识。可用于请求明细溯源和问题排查。

code string

请求失败的错误码。请求成功时不会返回此参数,详情请参见错误信息

message string

请求失败的详细信息。请求成功时不会返回此参数,详情请参见错误信息

步骤2:根据任务ID查询结果

GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}

说明
  • 轮询建议:视频生成过程约需数分钟,建议采用轮询机制,并设置合理的查询间隔(如 15 秒)来获取结果。

  • 任务状态流转:PENDING(排队中)→ RUNNING(处理中)→ SUCCEEDED(成功)/ FAILED(失败)。

  • 结果链接:任务成功后返回视频链接,有效期为 24 小时。建议在获取链接后立即下载并转存至永久存储(如阿里云 OSS)。

  • task_id 有效期24小时,超时后将无法查询结果,接口将返回任务状态为UNKNOWN

  • QPS 限制:查询接口默认QPS20。如需更高频查询或事件通知,建议配置异步任务回调

  • 更多操作:如需批量查询、取消任务等操作,请参见管理异步任务

请求参数

查询任务结果

请将86ecf553-d340-4e21-xxxxxxxxx替换为真实的task_id。

curl -X GET https://dashscope.aliyuncs.com/api/v1/tasks/86ecf553-d340-4e21-xxxxxxxxx \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"
请求头(Headers)

Authorization string(必选)

请求身份认证。接口使用阿里云百炼API-Key进行身份认证。示例值:Bearer sk-xxxx。

URL路径参数(Path parameters)

task_id string(必选)

任务ID。

响应参数

任务执行成功

视频URL仅保留24小时,超时后会被自动清除,请及时保存生成的视频。

{
    "request_id": "2ca1c497-f9e0-449d-9a3f-xxxxxx",
    "output": {
        "task_id": "af6efbc0-4bef-4194-8246-xxxxxx",
        "task_status": "SUCCEEDED",
        "submit_time": "2025-09-25 11:07:28.590",
        "scheduled_time": "2025-09-25 11:07:35.349",
        "end_time": "2025-09-25 11:17:11.650",
        "orig_prompt": "一幅都市奇幻艺术的场景。一个充满动感的涂鸦艺术角色。一个由喷漆所画成的少年,正从一面混凝土墙上活过来。他一边用极快的语速演唱一首英文rap,一边摆着一个经典的、充满活力的说唱歌手姿势。场景设定在夜晚一个充满都市感的铁路桥下。灯光来自一盏孤零零的街灯,营造出电影般的氛围,充满高能量和惊人的细节。视频的音频部分完全由少年的rap构成,没有其他对话或杂音。",
        "video_url": "https://dashscope-result-sh.oss-cn-shanghai.aliyuncs.com/xxx.mp4?Expires=xxx",
        "actual_prompt": "一位由喷漆构成的少年从混凝土墙中浮现,开始用极快语速演唱英文rap,嘴唇快速开合,头部轻微晃动,视线直视镜头。他右手竖起大拇指指向墙面,左手叉腰,身体随节奏前后移动。音频为少年连续演唱的英文rap,内容为:'Skyscrapers loom, shadows kiss the pavement. Dreams stack high, but the soul's in the basement. Pocket full of lint, chasing gold like it's sacred. Every breath a gamble, the odds never patient.'"
    },
    "usage": {
        "duration": 10,
        "video_count": 1,
        "SR": 480
    }
}

任务执行失败

若任务执行失败,task_status将置为 FAILED,并提供错误码和信息。请参见错误信息进行解决。

{
    "request_id": "e5d70b02-ebd3-98ce-9fe8-759d7d7b107d",
    "output": {
        "task_id": "86ecf553-d340-4e21-af6e-a0c6a421c010",
        "task_status": "FAILED",
        "code": "InvalidParameter",
        "message": "The size is not match xxxxxx"
    }
}

任务查询过期

task_id查询有效期为 24 小时,超时后将无法查询,返回以下报错信息。

{
    "request_id": "a4de7c32-7057-9f82-8581-xxxxxx",
    "output": {
        "task_id": "502a00b1-19d9-4839-a82f-xxxxxx",
        "task_status": "UNKNOWN"
    }
}

output object

任务输出信息。

属性

task_id string

任务ID。查询有效期24小时。

task_status string

任务状态。

枚举值

  • PENDING:任务排队中

  • RUNNING:任务处理中

  • SUCCEEDED:任务执行成功

  • FAILED:任务执行失败

  • CANCELED:任务已取消

  • UNKNOWN:任务不存在或状态未知

轮询过程中的状态流转:

  • PENDING(排队中) → RUNNING(处理中)→ SUCCEEDED(成功)/ FAILED(失败)。

  • 初次查询状态通常为 PENDING(排队中)或 RUNNING(处理中)。

  • 当状态变为 SUCCEEDED 时,响应中将包含生成的视频url。

  • 若状态为 FAILED,请检查错误信息并重试。

submit_time string

任务提交时间。格式为 YYYY-MM-DD HH:mm:ss.SSS。

scheduled_time string

任务执行时间。格式为 YYYY-MM-DD HH:mm:ss.SSS。

end_time string

任务完成时间。格式为 YYYY-MM-DD HH:mm:ss.SSS。

video_url string

视频URL。仅在 task_status 为 SUCCEEDED 时返回。

链接有效期24小时,可通过此URL下载视频。视频格式为MP4(H.264 编码)。

orig_prompt string

原始输入的prompt,对应请求参数prompt

actual_prompt string

开启 prompt 智能改写后,返回实际使用的优化后 prompt。若未开启该功能,则不返回此字段。

code string

请求失败的错误码。请求成功时不会返回此参数,详情请参见错误信息

message string

请求失败的详细信息。请求成功时不会返回此参数,详情请参见错误信息

usage object

输出信息统计,只对成功的结果计数。

属性

video_duration integer

当前仅当2.1模型返回此字段。生成视频的时长,单位为秒。枚举值为3、4、5。

计费公式:费用 = 视频秒数 × 单价。

video_ratio string

当前仅当2.1模型返回此字段。生成视频的比例。固定为standard。

duration integer

当前仅当2.2及以上模型返回此字段。生成视频的时长,单位为秒。枚举值为5、10。

计费公式:费用 = 视频秒数 × 单价。

SR integer

当前仅当2.2及以上模型返回此字段。生成视频的分辨率。枚举值为480、720、1080。

video_count integer

生成视频的数量。固定为1。

request_id string

请求唯一标识。可用于请求明细溯源和问题排查。

DashScope SDK调用

SDK 的参数命名与HTTP接口基本一致,参数结构根据语言特性进行封装。

由于图生视频任务耗时较长(通常为1-5分钟),SDK 在底层封装了 HTTP 异步调用流程,支持同步、异步两种调用方式。

具体耗时受限于排队任务数和服务执行情况,请在获取结果时耐心等待。

Python SDK调用

Python SDK 支持三种图像输入方式:公网 URL、Base64 编码字符串、本地文件路径(绝对/相对),任选其一即可,具体参见输入图像

说明
  • 推荐安装最新版DashScope Python SDK,否则可能运行报错:安装或升级SDK

  • wan2.5-i2v-preview模型暂不支持SDK调用。

示例代码

同步调用

同步调用会阻塞等待,直到视频生成完成并返回结果。本示例展示三种图像输入方式:公网URL、Base64编码、本地文件路径。

请求示例
import base64
import os
from http import HTTPStatus
from dashscope import VideoSynthesis
import mimetypes
import dashscope

# 以下为北京地域url,若使用新加坡地域的模型,需将url替换为:https://dashscope-intl.aliyuncs.com/api/v1
dashscope.base_http_api_url = 'https://dashscope.aliyuncs.com/api/v1'

# 若没有配置环境变量,请用百炼API Key将下行替换为:api_key="sk-xxx"
# 新加坡和北京地域的API Key不同。获取API Key:https://help.aliyun.com/zh/model-studio/get-api-key
api_key = os.getenv("DASHSCOPE_API_KEY")

# --- 辅助函数:用于 Base64 编码 ---
# 格式为 data:{MIME_type};base64,{base64_data}
def encode_file(file_path):
    mime_type, _ = mimetypes.guess_type(file_path)
    if not mime_type or not mime_type.startswith("image/"):
        raise ValueError("不支持或无法识别的图像格式")
    with open(file_path, "rb") as image_file:
        encoded_string = base64.b64encode(image_file.read()).decode('utf-8')
    return f"data:{mime_type};base64,{encoded_string}"

"""
图像输入方式说明:
以下提供了三种图片输入方式,三选一即可

1. 使用公网URL - 适合已有公开可访问的图片
2. 使用本地文件 - 适合本地开发测试
3. 使用Base64编码 - 适合私有图片或需要加密传输的场景
"""

# 【方式一】使用公网可访问的图片URL
# 示例:使用一个公开的图片URL
img_url = "https://cdn.translate.alibaba.com/r/wanx-demo-1.png"

# 【方式二】使用本地文件(支持绝对路径和相对路径)
# 格式要求:file:// + 文件路径
# 示例(绝对路径):
# img_url = "file://" + "/path/to/your/img.png"    # Linux/macOS
# img_url = "file://" + "C:/path/to/your/img.png"  # Windows
# 示例(相对路径):
# img_url = "file://" + "./img.png"                # 相对当前执行文件的路径

# 【方式三】使用Base64编码的图片
# img_url = encode_file("./img.png")

def sample_call_i2v():
    # 同步调用,直接返回结果
    print('please wait...')
    rsp = VideoSynthesis.call(api_key=api_key,
                              model='wan2.2-i2v-plus',
                              prompt='一只猫在草地上奔跑',
                              resolution="1080P",
                              img_url=img_url)
    print(rsp)
    if rsp.status_code == HTTPStatus.OK:
        print("video_url:", rsp.output.video_url)
    else:
        print('Failed, status_code: %s, code: %s, message: %s' %
              (rsp.status_code, rsp.code, rsp.message))


if __name__ == '__main__':
    sample_call_i2v()
响应示例
video_url 有效期24小时,请及时下载视频。
{
    "status_code": 200,
    "request_id": "a77bde74-d20a-97cb-8384-xxxxxx",
    "code": null,
    "message": "",
    "output": {
        "task_id": "66ca2804-1e64-468f-b554-xxxxxx",
        "task_status": "SUCCEEDED",
        "video_url": "https://dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com/xxx.mp4?xxxxxx",
        "submit_time": "2025-07-27 21:15:19.582",
        "scheduled_time": "2025-07-27 21:15:19.613",
        "end_time": "2025-07-27 21:18:00.047",
        "orig_prompt": "一只猫在草地上奔跑",
        "actual_prompt": "一只白猫在草地上奔跑,尾巴高高扬起,步伐轻快。"
    },
    "usage": {
        "video_count": 1,
        "video_duration": 0,
        "video_ratio": "",
        "duration": 5,
        "SR": 1080
    }
}

异步调用

本示例展示异步调用方式。该方式会立即返回任务ID,需要自行轮询或等待任务完成。

请求示例
import os
from http import HTTPStatus
from dashscope import VideoSynthesis
import dashscope

# 以下为北京地域url,若使用新加坡地域的模型,需将url替换为:https://dashscope-intl.aliyuncs.com/api/v1
dashscope.base_http_api_url = 'https://dashscope.aliyuncs.com/api/v1'

# 若没有配置环境变量,请用百炼API Key将下行替换为:api_key="sk-xxx"
# 新加坡和北京地域的API Key不同。获取API Key:https://help.aliyun.com/zh/model-studio/get-api-key
api_key = os.getenv("DASHSCOPE_API_KEY")

# 使用公网可访问的图片URL
img_url = "https://cdn.translate.alibaba.com/r/wanx-demo-1.png"


def sample_async_call_i2v():
    # 异步调用,返回一个task_id
    rsp = VideoSynthesis.async_call(api_key=api_key,
                                    model='wan2.2-i2v-plus',
                                    prompt='一只猫在草地上奔跑',
                                    resolution="1080P",
                                    img_url=img_url)
    print(rsp)
    if rsp.status_code == HTTPStatus.OK:
        print("task_id: %s" % rsp.output.task_id)
    else:
        print('Failed, status_code: %s, code: %s, message: %s' %
              (rsp.status_code, rsp.code, rsp.message))

    # 获取异步任务信息
    status = VideoSynthesis.fetch(rsp)
    if status.status_code == HTTPStatus.OK:
        print(status.output.task_status)
    else:
        print('Failed, status_code: %s, code: %s, message: %s' %
              (status.status_code, status.code, status.message))

    # 等待异步任务结束
    rsp = VideoSynthesis.wait(rsp)
    print(rsp)
    if rsp.status_code == HTTPStatus.OK:
        print(rsp.output.video_url)
    else:
        print('Failed, status_code: %s, code: %s, message: %s' %
              (rsp.status_code, rsp.code, rsp.message))


if __name__ == '__main__':
    sample_async_call_i2v()
响应示例

1、创建任务的响应示例

{
    "status_code": 200,
    "request_id": "6dc3bf6c-be18-9268-9c27-xxxxxx",
    "code": "",
    "message": "",
    "output": {
        "task_id": "686391d9-7ecf-4290-a8e9-xxxxxx",
        "task_status": "PENDING",
        "video_url": ""
    },
    "usage": null
}

2、查询任务结果的响应示例

video_url 有效期24小时,请及时下载视频。
{
    "status_code": 200,
    "request_id": "a77bde74-d20a-97cb-8384-xxxxxx",
    "code": null,
    "message": "",
    "output": {
        "task_id": "66ca2804-1e64-468f-b554-xxxxxx",
        "task_status": "SUCCEEDED",
        "video_url": "https://dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com/xxx.mp4?xxxxxx",
        "submit_time": "2025-07-27 21:15:19.582",
        "scheduled_time": "2025-07-27 21:15:19.613",
        "end_time": "2025-07-27 21:18:00.047",
        "orig_prompt": "一只猫在草地上奔跑",
        "actual_prompt": "一只白猫在草地上奔跑,尾巴高高扬起,步伐轻快。"
    },
    "usage": {
        "video_count": 1,
        "video_duration": 0,
        "video_ratio": "",
        "duration": 5,
        "SR": 1080
    }
}

Java SDK调用

Java SDK 支持三种图像输入方式:公网 URL、Base64 编码字符串、本地文件路径(绝对路径),任选其一即可,具体参见输入图像

说明
  • 推荐安装最新版DashScope Java SDK,否则可能运行报错:安装或升级SDK

  • wan2.5-i2v-preview模型暂不支持SDK调用。

示例代码

同步调用

同步调用会阻塞等待,直到视频生成完成并返回结果。本示例展示三种图像输入方式:公网URL、Base64编码、本地文件路径。

请求示例
// Copyright (c) Alibaba, Inc. and its affiliates.

import com.alibaba.dashscope.aigc.videosynthesis.VideoSynthesis;
import com.alibaba.dashscope.aigc.videosynthesis.VideoSynthesisParam;
import com.alibaba.dashscope.aigc.videosynthesis.VideoSynthesisResult;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import com.alibaba.dashscope.utils.JsonUtils;
import com.alibaba.dashscope.utils.Constants;

import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.Base64;
import java.util.HashMap;
import java.util.Map;

/**
 * 环境要求
 *      dashscope java SDK >= 2.20.9
 * 更新maven依赖:
 *      https://mvnrepository.com/artifact/com.alibaba/dashscope-sdk-java
 */
 
public class Image2Video {

    static {
        // 以下为北京地域url,若使用新加坡地域的模型,需将url替换为:https://dashscope-intl.aliyuncs.com/api/v1
        Constants.baseHttpApiUrl = "https://dashscope.aliyuncs.com/api/v1";
    }

    // 若没有配置环境变量,请用百炼API Key将下行替换为:apiKey="sk-xxx"
    // 新加坡和北京地域的API Key不同。获取API Key:https://help.aliyun.com/zh/model-studio/get-api-key
    static String apiKey = System.getenv("DASHSCOPE_API_KEY");
    
    /**
     * 图像输入方式说明:三选一即可
     *
     * 1. 使用公网URL - 适合已有公开可访问的图片
     * 2. 使用本地文件 - 适合本地开发测试
     * 3. 使用Base64编码 - 适合私有图片或需要加密传输的场景
     */

    //【方式一】公网URL
    static String imgUrl = "https://cdn.translate.alibaba.com/r/wanx-demo-1.png";

    //【方式二】本地文件路径(file://+绝对路径)
    // static String imgUrl = "file://" + "/your/path/to/img.png";    // Linux/macOS
    // static String imgUrl = "file://" + "C:/your/path/to/img.png";  // Windows

    //【方式三】Base64编码
    // static String imgUrl = Image2Video.encodeFile("/your/path/to/img.png");

    public static void image2video() throws ApiException, NoApiKeyException, InputRequiredException {
        // 设置parameters参数
        Map<String, Object> parameters = new HashMap<>();
        parameters.put("prompt_extend", true);

        VideoSynthesis vs = new VideoSynthesis();
        VideoSynthesisParam param =
                VideoSynthesisParam.builder()
                        .apiKey(apiKey)
                        .model("wan2.2-i2v-plus")
                        .prompt("一只猫在草地上奔跑")
                        .imgUrl(imgUrl)
                        .parameters(parameters)
                        .resolution("1080P")
                        .build();
        System.out.println("please wait...");
        VideoSynthesisResult result = vs.call(param);
        System.out.println(JsonUtils.toJson(result));
    }
    
     /**
     * 将文件编码为Base64字符串
     * @param filePath 文件路径
     * @return Base64字符串,格式为 data:{MIME_type};base64,{base64_data}
     */
    public static String encodeFile(String filePath) {
        Path path = Paths.get(filePath);
        if (!Files.exists(path)) {
            throw new IllegalArgumentException("文件不存在: " + filePath);
        }
        // 检测MIME类型
        String mimeType = null;
        try {
            mimeType = Files.probeContentType(path);
        } catch (IOException e) {
            throw new IllegalArgumentException("无法检测文件类型: " + filePath);
        }
        if (mimeType == null || !mimeType.startsWith("image/")) {
            throw new IllegalArgumentException("不支持或无法识别的图像格式");
        }
        // 读取文件内容并编码
        byte[] fileBytes = null;
        try{
            fileBytes = Files.readAllBytes(path);
        } catch (IOException e) {
            throw new IllegalArgumentException("无法读取文件内容: " + filePath);
        }
    
        String encodedString = Base64.getEncoder().encodeToString(fileBytes);
        return "data:" + mimeType + ";base64," + encodedString;
    }
    

    public static void main(String[] args) {
        try {
            image2video();
        } catch (ApiException | NoApiKeyException | InputRequiredException e) {
            System.out.println(e.getMessage());
        }
        System.exit(0);
    }
}
响应示例
video_url 有效期24小时,请及时下载视频。
{
    "request_id": "3171aa20-c479-9dc2-ae55-xxxxxx",
    "output": {
        "task_id": "8b61b356-45ad-45f3-9be2-xxxxxx",
        "task_status": "SUCCEEDED",
        "video_url": "https://dashscope-result-sh.oss-cn-shanghai.aliyuncs.com/xxx.mp4?xxxxxx"
    },
    "usage": {
        "video_count": 1,
        "video_duration": 5,
        "video_ratio": "standard"
    }
}

异步调用

本示例展示异步调用方式。该方式会立即返回任务ID,需要自行轮询或等待任务完成。

请求示例
// Copyright (c) Alibaba, Inc. and its affiliates.

import com.alibaba.dashscope.aigc.videosynthesis.VideoSynthesis;
import com.alibaba.dashscope.aigc.videosynthesis.VideoSynthesisListResult;
import com.alibaba.dashscope.aigc.videosynthesis.VideoSynthesisParam;
import com.alibaba.dashscope.aigc.videosynthesis.VideoSynthesisResult;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import com.alibaba.dashscope.task.AsyncTaskListParam;
import com.alibaba.dashscope.utils.JsonUtils;
import com.alibaba.dashscope.utils.Constants;

import java.util.HashMap;
import java.util.Map;

/**
 * 环境要求
 *      dashscope java SDK >= 2.20.1
 * 更新maven依赖:
 *      https://mvnrepository.com/artifact/com.alibaba/dashscope-sdk-java
 */

public class Image2Video {

    static {
        // 以下为北京地域url,若使用新加坡地域的模型,需将url替换为:https://dashscope-intl.aliyuncs.com/api/v1
        Constants.baseHttpApiUrl = "https://dashscope.aliyuncs.com/api/v1";
    }

    // 若没有配置环境变量,请用百炼API Key将下行替换为:apiKey="sk-xxx"
    // 新加坡和北京地域的API Key不同。获取API Key:https://help.aliyun.com/zh/model-studio/get-api-key
    static String apiKey = System.getenv("DASHSCOPE_API_KEY");

    static String imgUrl = "https://cdn.translate.alibaba.com/r/wanx-demo-1.png";

    public static void image2video() throws ApiException, NoApiKeyException, InputRequiredException {
        // 设置parameters参数
        Map<String, Object> parameters = new HashMap<>();
        parameters.put("prompt_extend", true);

        VideoSynthesis vs = new VideoSynthesis();
        VideoSynthesisParam param =
                VideoSynthesisParam.builder()
                        .apiKey(apiKey)
                        .model("wanx2.1-i2v-turbo")
                        .prompt("一只猫在草地上奔跑")
                        .imgUrl(imgUrl)
                        .parameters(parameters)
                        .build();
        // 异步调用
        VideoSynthesisResult task = vs.asyncCall(param);
        System.out.println(JsonUtils.toJson(task));
        System.out.println("please wait...");

        //获取结果
        VideoSynthesisResult result = vs.wait(task, apiKey);
        System.out.println(JsonUtils.toJson(result));
    }

    // 获取任务列表
    public static void listTask() throws ApiException, NoApiKeyException {
        VideoSynthesis is = new VideoSynthesis();
        AsyncTaskListParam param = AsyncTaskListParam.builder().build();
        VideoSynthesisListResult result = is.list(param);
        System.out.println(result);
    }

    // 获取单个任务结果
    public void fetchTask(String taskId) throws ApiException, NoApiKeyException {
        VideoSynthesis is = new VideoSynthesis();
        // 如果已设置 DASHSCOPE_API_KEY 为环境变量,apiKey 可为空。
        VideoSynthesisResult result = is.fetch(taskId, null);
        System.out.println(result.getOutput());
        System.out.println(result.getUsage());
    }

    public static void main(String[] args) {
        try {
            image2video();
        } catch (ApiException | NoApiKeyException | InputRequiredException e) {
            System.out.println(e.getMessage());
        }
        System.exit(0);
    }
}
响应示例

1、创建任务的响应示例

{
    "request_id": "5dbf9dc5-4f4c-9605-85ea-xxxxxxxx",
    "output": {
        "task_id": "7277e20e-aa01-4709-xxxxxxxx",
        "task_status": "PENDING"
    }
}

2、查询任务结果的响应示例

video_url 有效期24小时,请及时下载视频。
{
    "request_id": "3d740fc4-a968-9c36-b0e7-xxxxxxxx",
    "output": {
        "task_id": "34dcf4b0-ed84-441e-91cb-xxxxxxxx",
        "task_status": "SUCCEEDED",
        "video_url": "https://dashscope-result-hz.oss-cn-hangzhou.aliyuncs.com/xxx.mp4?xxxxxx"
    },
    "usage": {
        "video_count": 1,
        "video_duration": 5,
        "video_ratio": "standard"
    }
}

使用限制

  • 数据时效:任务task_id和 视频url均只保留 24 小时,过期后将无法查询或下载。

  • 音频支持:wan2.5 支持有声视频(自动配音或上传自定义音频)。wan2.2 及以下版本仅输出无声视频,如有需要,可通过语音合成生成音频。

  • 内容审核:输入 prompt 和视频、输出视频均会经过内容安全审核,含违规内容将返回 “IPInfringementSuspect”或“DataInspectionFailed”错误,详见参见错误信息

  • 网络访问配置:视频链接存储于阿里云 OSS,如果业务系统因安全策略无法访问外部OSS链接,请将以下 OSS 域名加入网络访问白名单。

    # OSS域名列表
    dashscope-result-bj.oss-cn-beijing.aliyuncs.com
    dashscope-result-hz.oss-cn-hangzhou.aliyuncs.com
    dashscope-result-sh.oss-cn-shanghai.aliyuncs.com
    dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com
    dashscope-result-zjk.oss-cn-zhangjiakou.aliyuncs.com
    dashscope-result-sz.oss-cn-shenzhen.aliyuncs.com
    dashscope-result-hy.oss-cn-heyuan.aliyuncs.com
    dashscope-result-cd.oss-cn-chengdu.aliyuncs.com
    dashscope-result-gz.oss-cn-guangzhou.aliyuncs.com
    dashscope-result-wlcb-acdr-1.oss-cn-wulanchabu-acdr-1.aliyuncs.com

关键参数说明

输入图像

输入图像 img_url 参数支持以下三种方式传入:

方式一:公网URL

  • 一个公网可直接访问的地址,支持 HTTP/HTTPS。本地文件可通过上传文件获取临时URL

  • 示例值:https://example.com/images/cat.png

方式二:Base 64编码

示例代码

import base64
import mimetypes


# ---用于 Base64 编码 ---
# 格式为 data:{MIME_type};base64,{base64_data}
def encode_file(file_path):
    mime_type, _ = mimetypes.guess_type(file_path)
    if not mime_type or not mime_type.startswith("image/"):
        raise ValueError("不支持或无法识别的图像格式")
    with open(file_path, "rb") as image_file:
        encoded_string = base64.b64encode(image_file.read()).decode('utf-8')
    return f"data:{mime_type};base64,{encoded_string}"


if __name__ == "__main__":
    print(encode_file("./image_demo_input.png"))
  • 示例值:......因长度限制仅展示片段)。调用时,需传入完整字符串。

  • 编码格式:遵循 data:{MIME_type};base64,{base64_data} 的格式,其中:

    • {base64_data}:图像文件经过 Base64 编码后的字符串。

    • {MIME_type}:图像的媒体类型,需与文件格式对应。

      图像格式

      MIME Type

      JPEG

      image/jpeg

      JPG

      image/jpeg

      PNG

      image/png

      BMP

      image/bmp

      WEBP

      image/webp

方式三:本地文件路径(仅限 SDK)

  • Python SDK:支持传入文件的绝对路径和相对路径。文件路径规则如下:

    系统

    传入的文件路径

    示例(绝对路径)

    示例(相对路径)

    LinuxmacOS系统

    file://{文件的绝对路径或相对路径}

    file:///home/images/test.png

    file://./images/test.png

    Windows系统

    file://D:/images/test.png

    file://./images/test.png

  • Java SDK:仅支持传入文件的绝对路径。文件路径规则如下:

    系统

    传入的文件路径

    示例(绝对路径)

    LinuxmacOS系统

    file://{文件的绝对路径}

    file:///home/images/test.png

    Windows系统

    file:///{文件的绝对路径}

    file:///D:/images/test.png

音频设置

支持的模型:wan2.5-i2v-preview。

音频设置:通过input.audio_url和 parameters.audio参数组合控制音频行为,参数优先级:audio_url > audio。支持三种模式:

  1. 生成无声视频

    1. 参数设置:不传audio_url,且 audio 为 false。

    2. 适用场景:纯视觉内容展示,后期自行添加音频或配乐。

  2. 自动生成音频

    1. 参数设置:不传audio_url,且 audio 为 true。

    2. 效果说明:模型根据提示词和画面内容,自动生成匹配的背景音频或音乐。

  3. 使用自定义音频

    1. 参数设置:传入 audio_url(此时 audio参数无效)。

    2. 效果说明:视频画面会与音频内容对齐(如口型、节奏等)。

计费与限流

  • 模型免费额度和计费单价请参见模型列表与价格

  • 模型限流请参见通义万相系列

  • 计费说明:

    • 按成功生成的 视频秒数 计费。仅当查询结果接口返回task_statusSUCCEEDED 并成功生成视频后,才会计费。

    • 模型调用失败或处理错误不产生任何费用,也不消耗免费额度

    • 图生视频还支持节省计划,抵扣顺序为 免费额度 > 节省计划 > 按量付费

错误码

如果模型调用失败并返回报错信息,请参见错误信息进行解决。

常见问题

视频FAQ快速入口常见问题

Q:如何生成特定宽高比(如9:16)的视频?

A: 输出视频的宽高比完全由输入的首帧图像 img_url 决定。例如,要生成 9:16 的竖屏视频,必须提供一张 9:16 比例的输入图片。resolution 参数仅用于调整视频的清晰度(总像素),不会改变其宽高比。

附录

图生视频基础功能示例

模型功能

输入首帧图像

输入提示词

输出视频

无声视频

image

一只猫在草地上奔跑

视频特效

image

输入特效参数:“template:flying”

“魔法悬浮”特效