请求参数 | 多图参考curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
"model": "wanx2.1-vace-plus",
"input": {
"function": "image_reference",
"prompt": "视频中,一位女孩自晨雾缭绕的古老森林深处款款走出,她步伐轻盈,镜头捕捉她每一个灵动瞬间。当女孩站定,环顾四周葱郁林木时,她脸上绽放出惊喜与喜悦交织的笑容。这一幕,定格在了光影交错的瞬间,记录下女孩与大自然的美妙邂逅。",
"ref_images_url": [
"http://wanx.alicdn.com/material/20250318/image_reference_2_5_16.png",
"http://wanx.alicdn.com/material/20250318/image_reference_1_5_16.png"
]
},
"parameters": {
"obj_or_bg": ["obj","bg"],
"size": "1280*720"
}
}'
视频重绘curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
"model": "wanx2.1-vace-plus",
"input": {
"function": "video_repainting",
"prompt": "视频展示了一辆黑色的蒸汽朋克风格汽车,绅士驾驶着,车辆装饰着齿轮和铜管。背景是蒸汽驱动的糖果工厂和复古元素,画面复古与趣味。",
"video_url": "http://wanx.alicdn.com/material/20250318/video_repainting_1.mp4"
},
"parameters": {
"control_condition": "depth"
}
}'
局部编辑curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
"model": "wanx2.1-vace-plus",
"input": {
"function": "video_edit",
"prompt": "视频展示了一家巴黎风情的法式咖啡馆,一只穿着西装的狮子优雅地品着咖啡。它一手端着咖啡杯,轻轻啜饮,神情惬意。咖啡馆装饰雅致,柔和的色调与温暖灯光映照着狮子所在的区域。",
"mask_image_url": "http://wanx.alicdn.com/material/20250318/video_edit_1_mask.png",
"video_url": "http://wanx.alicdn.com/material/20250318/video_edit_2.mp4",
"mask_frame_id": 1
},
"parameters": {
"mask_type": "tracking",
"expand_ratio": 0.05
}
}'
视频延展curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
"model": "wanx2.1-vace-plus",
"input": {
"function": "video_extension",
"prompt": "一只戴着墨镜的狗在街道上滑滑板,3D卡通。",
"first_clip_url": "http://wanx.alicdn.com/material/20250318/video_extension_1.mp4"
},
"parameters": {}
}'
视频画面扩展curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/video-generation/video-synthesis' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
"model": "wanx2.1-vace-plus",
"input": {
"function": "video_outpainting",
"prompt": "一位优雅的女士正在激情演奏小提琴,她身后是一支完整的交响乐团。",
"video_url": "http://wanx.alicdn.com/material/20250318/video_outpainting_1.mp4"
},
"parameters": {
"top_scale": 1.5,
"bottom_scale": 1.5,
"left_scale": 1.5,
"right_scale": 1.5
}
}'
|
请求头(Headers) |
Content-Type string (必选) 请求内容类型。此参数必须设置为application/json 。 |
Authorization string (必选) 请求身份认证。接口使用阿里云百炼API-Key进行身份认证。示例值:Bearer sk-xxxx。 |
X-DashScope-Async string (必选) 异步处理配置参数。HTTP请求只支持异步,必须设置为enable 。 |
请求体(Request Body) |
多图参考model string (必选) 模型名称。示例值:wanx2.1-vace-plus。 input object (必选) 输入的基本信息,如提示词等。 属性 prompt string (必选) 提示词,用来描述生成视频中期望包含的元素和视觉特点。 支持中英文,长度不超过800个字符,每个汉字/字母占一个字符,超过部分会自动截断。 提示词技巧请参见文生视频/图生视频Prompt指南。 function string (必选) 功能名称。多图参考设置为image_reference 。 多图参考支持最多3张参考图。图像内容可以包括主体与背景,例如人物、动物、服饰、场景等。使用 prompt 描述期望生成的视频画面内容,模型可将多张图片融合生成连贯的视频内容。 ref_images_url array[string] (必选) 输入参考图像的URL 数组。 URL 需为公网可访问地址,支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。 参考图像支持 1-3 张图像,若超过 3 张,则仅保留前 3 张作为输入。 图像限制: 使用建议: | parameters object (可选) 视频处理参数,如设置水印等。 属性 obj_or_bg array[string] (可选) 该参数用于标识每张参考图像的用途,与 ref_images_url 参数一一对应。数组中每个元素表示对应位置的图像为“主体”还是“背景”: 使用说明: 示例值: ["obj", "obj", "bg"]。 size string (可选) 生成视频的分辨率(宽*高)。目前支持生成720P 视频,分辨率的取值为: duration integer (可选) 视频生成时长,单位为秒。当前参数值固定为5,且不支持修改。模型将始终生成5秒时长的视频。 prompt_extend bool (可选) 是否开启prompt智能改写。开启后使用大模型对输入prompt进行智能改写。对于较短的prompt生成效果提升明显,但会增加耗时。 true (默认值):开启智能改写。
false :关闭智能改写。
seed integer (可选) 随机数种子,用于控制模型生成内容的随机性。seed参数取值范围是[0, 2147483647] 。 如果不提供,则算法自动生成一个随机数作为种子。如果您希望生成内容保持相对稳定,请使用相同的seed参数值。 watermark bool (可选) 是否添加水印标识,水印位于图片右下角,文案为“AI生成”。 false (默认值):不添加水印。
true :添加水印。
|
视频重绘model string (必选) 模型名称。示例值:wanx2.1-vace-plus。 input object (必选) 输入的基本信息,如提示词等。 属性 prompt string (必选) 提示词,用来描述生成视频中期望包含的元素和视觉特点。 支持中英文,长度不超过800个字符,每个汉字/字母占一个字符,超过部分会自动截断。 提示词技巧请参见文生视频/图生视频Prompt指南。 function string (必选) 功能名称。视频重绘设置为 video_repainting 。 视频重绘支持从输入视频中提取主体姿态与动作、构图与运动轮廓以及线稿结构,结合文本提示词(prompt),生成具有相同动态特征的新视频。同时,还支持通过参考图像替换原视频中的主体,例如更换角色形象但仍保留原有动作。 video_url string (必选) 输入视频的URL地址。 URL 需为公网可访问地址,支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。 视频限制: 视频格式:MP4。 视频帧率:大于等于16FPS。 视频大小:不超过50MB。 视频长度:不超过5秒,否则取视频的前5秒。 URL地址中不能包含中文字符。
关于输出视频的分辨率: 关于输出视频的时长: ref_images_url array[string] (可选) 输入参考图像的 URL数组。URL 需为公网可访问地址,支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。 仅支持传入1张参考图像,且该图像建议为主体图像,用于替换输入视频中的主体内容。 图像限制: 使用建议: | parameters object (必选) 视频处理参数,如设置水印等。 属性 control_condition string (必选) 设置视频特征提取的方式。 strength float (可选) 调节 control_condition 所指定的视频特征提取方式对生成视频的控制强度。 默认值为1.0,取值范围[0.0, 1.0]。 数值越大,生成视频越贴近原视频动作和构图;数值越小,生成内容越自由。 prompt_extend bool (可选) 是否开启prompt智能改写。开启后使用大模型对输入prompt进行智能改写。对于较短的prompt生成效果提升明显,但会增加耗时。 false (默认值):关闭智能改写。(推荐)
true :开启智能改写。
当文本描述与输入的视频内容不一致时,模型可能产生误解。建议关闭智能扩写,并在 prompt 中提供清晰、具体的画面描述,以提升生成一致性与准确性。 seed integer (可选) 随机数种子,用于控制模型生成内容的随机性。seed参数取值范围是[0, 2147483647] 。 如果不提供,则算法自动生成一个随机数作为种子。如果您希望生成内容保持相对稳定,请使用相同的seed参数值。 watermark bool (可选) 是否添加水印标识,水印位于图片右下角,文案为“AI生成”。 false (默认值):不添加水印。
true :添加水印。
|
局部编辑model string (必选) 模型名称。示例值:wanx2.1-vace-plus。 input object (必选) 输入的基本信息,如提示词等。 属性 prompt string (必选) 提示词,用来描述生成视频中期望包含的元素和视觉特点。 支持中英文,长度不超过800个字符,每个汉字/字母占一个字符,超过部分会自动截断。 提示词技巧请参见文生视频/图生视频Prompt指南。 function string (必选) 功能名称。局部编辑设置为 video_edit 。 局部编辑支持对输入视频的指定区域进行增加、修改或删除元素,还可以对编辑区域的主体或背景进行替换,实现精细化的视频编辑。 video_url string (必选) 输入视频的URL地址。 URL 需为公网可访问地址,支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。 视频限制: 视频格式:MP4。 视频帧率:大于等于16FPS。 视频大小:不超过50MB。 视频长度:不超过5秒,否则取视频的前5秒。 URL地址中不能包含中文字符。
关于输出视频的分辨率: 关于输出视频的时长: ref_images_url array[string] (可选) 输入参考图像的URL数组。 URL 需为公网可访问地址,支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。 当前仅支持传入 1 张 参考图像 ,该图像可作为主体或背景使用,用于替换输入视频中的对应内容。 图像限制: 使用建议: mask_image_url string (可选) 掩码图像的URL地址。URL 需为公网可访问地址,支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。 该参数用于指定视频的编辑区域。与 mask_video_url 参数二选一填写,推荐优先使用此参数 。 掩码图像的白色区域(像素值严格为 [255, 255, 255])表示需要编辑的部分;黑色区域(像素值严格为 [0, 0, 0])表示保留不变的区域。 图像限制: mask_frame_id integer (可选) 当 mask_image_url 不为空时,该参数生效,用于标识掩码目标出现在视频中的哪一帧,以“帧 ID”表示。 默认值为 1,单位为帧,表示视频的第一帧(首帧)。 取值范围为[1, max_frame_id] ,其中max_frame_id=输入视频帧率*输入视频时长+1 。 例如,输入视频(video_url )帧率为16FPS,表示每秒 16 帧,视频时长为5秒,因此输入视频的总帧数为16*5+1=81,即max_frame_id=81。 mask_video_url string (可选) 掩码视频的URL地址。URL 需为公网可访问地址,支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。 该参数用于指定视频的编辑区域。与mask_image_url 参数,二选一填写。 掩码视频的视频格式、帧率、分辨率、长度需与输入视频(video_url )完全一致。 掩码视频的白色区域(像素值严格为 [255, 255, 255])表示需要编辑的部分;黑色区域(像素值严格为 [0, 0, 0])表示保留不变的区域。 | parameters object (可选) 视频处理参数,如设置水印等。 属性 control_condition string (可选) 设置视频特征提取的方式。默认为"",表示不做任何提取。 mask_type string (可选) 当 mask_image_url 不为空时,该参数生效,用于指定编辑区域的行为方式。 expand_ratio float (可选) 当 mask_type 为 tracking 时,该参数生效,表示对掩码区域进行向外扩展的比例。 取值范围为 [0.0, 1.0],默认值为 0.05。推荐使用默认值。 取值越小,掩码区域越贴合目标物体;取值越大,掩码区域的扩展范围越广。 expand_mode string (可选) 当 mask_type 为 tracking 时,该参数生效,表示掩码区域的形状。 算法会根据选择的expand_mode ,基于输入的掩码图像生成对应形状的掩码视频。支持的取值如下: hull (默认值):多边形模式,表示使用一个多边形包裹掩码目标。
bbox :边界框模式,表示使用一个矩形包裹掩码目标。
original :原始模式,表示尽量保持与原始掩码目标的形状一致。
size string (可选) 生成视频的分辨率(宽*高)。目前支持生成720P 视频,分辨率的取值为: duration integer (可选) 视频生成时长,单位为秒。当前参数值固定为5,且不支持修改。模型将始终生成5秒时长的视频。 prompt_extend bool (可选) 是否开启prompt智能改写。开启后使用大模型对输入prompt进行智能改写。对于较短的prompt生成效果提升明显,但会增加耗时。 false (默认值):关闭智能改写。(推荐)
true :开启智能改写。
当文本描述与输入的视频内容不一致时,模型可能产生误解。建议关闭智能扩写,并在 prompt 中提供清晰、具体的画面描述,以提升生成一致性与准确性。 seed integer (可选) 随机数种子,用于控制模型生成内容的随机性。seed参数取值范围是[0, 2147483647] 。 如果不提供,则算法自动生成一个随机数作为种子。如果您希望生成内容保持相对稳定,请使用相同的seed参数值。 watermark bool (可选) 是否添加水印标识,水印位于图片右下角,文案为“AI生成”。 false (默认值):不添加水印。
true :添加水印。
|
视频延展model string (必选) 模型名称。示例值:wanx2.1-vace-plus。 input object (必选) 输入的基本信息,如提示词等。 属性 prompt string (必选) 提示词,用来描述生成视频中期望包含的元素和视觉特点。 支持中英文,长度不超过800个字符,每个汉字/字母占一个字符,超过部分会自动截断。 提示词技巧请参见文生视频/图生视频Prompt指南。 function string (必选) 功能名称。视频延展设置为 video_extension 。 视频延展支持基于图像或视频生成延续性内容,还支持通过参考视频提取动态特征(如动作、构图等),用于指导生成具有相似运动表现的视频。 延长后的视频总时长为 5 秒 ,请注意:这是指最终输出视频的完整时长为 5 秒,而非在原视频基础上延长 5 秒。 first_frame_url string (可选) 首帧图像的URL地址。 URL 需为公网可访问地址,支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。 图像限制: last_frame_url string (可选) 尾帧图像的URL地址。URL 需为公网可访问地址,支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。 图像限制: first_clip_url string (可选) 首段视频的URL地址。URL 需为公网可访问地址,支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。 视频限制: 关于输出视频的分辨率: last_clip_url string (可选) 尾段视频的URL地址。URL 需为公网可访问地址,支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。 视频限制: 关于输出视频的分辨率: video_url string (可选) 输入视频的URL地址。URL 需为公网可访问地址,支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。 该视频主要用于提取其中的运动特征,与 first_frame_url 、 last_frame_url 、first_clip_url 、 last_clip_url 参数配合使用,以指导生成具有相似运动表现的延展视频。 视频限制: | parameters object (可选) 视频处理参数,如设置输出视频的分辨率等。 属性 control_condition string (可选) 设置视频特征提取的方式,输入video_url时必选。默认为"",表示不做任何提取。 duration integer (可选) 视频生成时长,单位为秒。当前参数值固定为5,且不支持修改。模型将始终生成5秒时长的视频。 prompt_extend bool (可选) 是否开启prompt智能改写。开启后使用大模型对输入prompt进行智能改写。对于较短的prompt生成效果提升明显,但会增加耗时。 false (默认值):关闭智能改写。(推荐)
true :开启智能改写。
当文本描述与输入的视频内容不一致时,模型可能产生误解。建议关闭智能扩写,并在 prompt 中提供清晰、具体的画面描述,以提升生成一致性与准确性。 seed integer (可选) 随机数种子,用于控制模型生成内容的随机性。seed参数取值范围是[0, 2147483647] 。 如果不提供,则算法自动生成一个随机数作为种子。如果您希望生成内容保持相对稳定,请使用相同的seed参数值。 watermark bool (可选) 是否添加水印标识,水印位于图片右下角,文案为“AI生成”。 false (默认值):不添加水印。
true :添加水印。
|
视频画面扩展model string (必选) 模型名称。示例值:wanx2.1-vace-plus。 input object (必选) 输入的基本信息,如提示词等。 属性 prompt string (必选) 提示词,用来描述生成视频中期望包含的元素和视觉特点。 支持中英文,长度不超过800个字符,每个汉字/字母占一个字符,超过部分会自动截断。 提示词技巧请参见文生视频/图生视频Prompt指南。 function string (必选) 功能名称。视频画面扩展设置为 video_outpainting 。 视频画面扩展支持对视频在上、下、左、右四个方向按比例扩展。 video_url string (必选) 输入视频的URL地址。 URL 需为公网可访问地址,支持 HTTP 或 HTTPS 协议。您也可在此获取临时公网URL。 视频限制: 视频格式:MP4。 视频帧率:大于等于16FPS。 视频大小:不超过50MB。 视频长度:不超过5秒,否则取视频的前5秒。 URL地址中不能包含中文字符。
关于输出视频的分辨率: 关于输出视频的时长: | parameters object (可选) 视频处理参数,如设置扩展比例等。 属性 top_scale float (可选) 视频画面居中,向上按比例扩展视频。 取值范围为[1.0, 2.0],默认值为1.0,表示不扩展。 bottom_scale float (可选) 视频画面居中,向下按比例扩展视频。 取值范围为[1.0, 2.0],默认值为1.0,表示不扩展。 left_scale float (可选) 视频画面居中,向左按比例扩展视频。 取值范围为[1.0, 2.0],默认值为1.0,表示不扩展。 right_scale float (可选) 视频画面居中,向右按比例扩展视频。 取值范围为[1.0, 2.0],默认值为1.0,表示不扩展。 duration integer (可选) 视频生成时长,单位为秒。当前参数值固定为5,且不支持修改。模型将始终生成5秒时长的视频。 prompt_extend bool (可选) 是否开启prompt智能改写。开启后使用大模型对输入prompt进行智能改写。对于较短的prompt生成效果提升明显,但会增加耗时。 false (默认值):关闭智能改写。(推荐)
true :开启智能改写。
当文本描述与输入的视频内容不一致时,模型可能产生误解。建议关闭智能扩写,并在 prompt 中提供清晰、具体的画面描述,以提升生成一致性与准确性。 seed integer (可选) 随机数种子,用于控制模型生成内容的随机性。seed参数取值范围是[0, 2147483647] 。 如果不提供,则算法自动生成一个随机数作为种子。如果您希望生成内容保持相对稳定,请使用相同的seed参数值。 watermark bool (可选) 是否添加水印标识,水印位于图片右下角,文案为“AI生成”。 false (默认值):不添加水印。
true :添加水印。
|
|