通义万相-图像生成与编辑2.6 API参考

通义万相图像生成模型支持图像编辑图文混合输出,满足多样化生成与集成需求。

模型概览

模型名称

模型简介

输出图像规格

wan2.6-image

万相2.6 image

支持图像编辑和图文混合输出

图片格式:PNG。

图像分辨率和尺寸请参见size参数

说明

调用前,请查阅各地域支持的模型列表与价格

前提条件

您需要已获取与配置 API Key配置API Key到环境变量

重要

北京和新加坡地域拥有独立的 API Key 请求地址,不可混用,跨地域调用将导致鉴权失败或服务报错。

HTTP调用

由于图像生成任务耗时较长(通常为1-2分钟),API采用异步调用。整个流程包含 “创建任务 -> 轮询获取” 两个核心步骤,具体如下:

具体耗时受限于排队任务数和服务执行情况,请在获取结果时耐心等待。

步骤1:创建任务获取任务ID

北京地域POST https://dashscope.aliyuncs.com/api/v1/services/aigc/image-generation/generation

新加坡地域POST https://dashscope-intl.aliyuncs.com/api/v1/services/aigc/image-generation/generation

说明
  • 创建成功后,使用接口返回的 task_id 查询结果,task_id 有效期为 24 小时。请勿重复创建任务,轮询获取即可。

  • 新手指引请参见Postman

请求参数

参考图生图

curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/image-generation/generation' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'X-DashScope-Async: enable' \
--data '{
    "model": "wan2.6-image",
    "input": {
        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "text": "参考图1的风格和图2的背景,生成番茄炒蛋"
                    },
                    {
                        "image": "https://cdn.wanx.aliyuncs.com/tmp/pressure/umbrella1.png"
                    },
                    {
                        "image": "https://img.alicdn.com/imgextra/i3/O1CN01SfG4J41UYn9WNt4X1_!!6000000002530-49-tps-1696-960.webp"
                    }
                ]
            }
        ]
    },
    "parameters": {
        "negative_prompt": "",
        "prompt_extend": true,
        "watermark": false,
        "n": 2,
        "size": "1280*1280"
    }
}'

图文混合输出

curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/image-generation/generation' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'X-DashScope-Async: enable' \
--data '{
    "model": "wan2.6-image",
    "input": {
        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "text": "给我一个3张图辣椒炒肉教程"
                    }
                ]
            }
        ]
    },
    "parameters": {
        "n": 1,
        "size": "1280*1280",
        "enable_interleave":true
    }
}'
请求头(Headers)

Content-Type string (必选)

请求内容类型。此参数必须设置为application/json

Authorization string(必选)

请求身份认证。接口使用阿里云百炼API-Key进行身份认证。示例值:Bearer sk-xxxx。

X-DashScope-Async string (必选)

异步处理配置参数。HTTP请求只支持异步,必须设置为enable

重要

缺少此请求头将报错:“current user api does not support synchronous calls”。

请求体(Request Body)

model string (必选)

模型名称。

示例值:wan2.6-image。

input object (必选)

输入的基本信息。

属性

messages array (必选)

请求内容数组。当前仅支持单轮对话,即传入一组role、content参数,不支持多轮对话。

属性

role string (必选)

消息的角色。此参数固定设置为user

content array (必选)

消息内容数组。

属性

text string (必选)

正向提示词用于描述您期望生成的图像内容、风格和构图。

支持中英文,长度不超过2000个字符,每个汉字、字母、数字或符号计为一个字符,超过部分会自动截断。

示例值:参考这个风格的图片,生成番茄炒蛋。

注意:仅支持传入一个text,不传或传入多个将报错。

image string (可选)

输入图像的URLBase64编码字符串。

可输入的图像总数量与parameters.enable_interleave参数有关。当输入多张图时,需在content数组中传入多个image对象。

  • enable_interleave=true时(图文混合输出),可输入0~1张图像。

  • enable_interleave=false时(参考图生图),必须输入1~3张图像。

  • 多图输入时,按照数组顺序定义图像顺序。

图像限制:

  • 图像格式:JPEG、JPG、PNG(不支持透明通道)、BMP、WEBP。

  • 图像分辨率:图像的宽高范围均为[384, 5000]像素。

  • 文件大小:不超过10MB。

支持的输入格式:

  1. 使用公网可访问URL

    • 支持 HTTP 或 HTTPS 协议。

    • 示例值:http://wanx.alicdn.com/material/xxx.jpeg

  2. 传入 Base64 编码图像后的字符串

    • 格式:data:{MIME_type};base64,{base64_data}

    • 示例:data:image/jpeg;base64,GDU7MtCZzEbTbmRZ...(仅示意,实际需传入完整字符串)

    • Base64 编码规范请参见图像传入方式

parameters object (可选)

图像处理参数。

属性

negative_prompt string (可选)

反向提示词,用于描述不希望在图像中出现的内容,对画面进行限制。

支持中英文,长度不超过500个字符,超出部分将自动截断。

示例值:低分辨率、错误、最差质量、低质量、残缺、多余的手指、比例不良等。

size string (可选)

输出图像的分辨率,格式为宽*高

  • wan2.6-image:默认值为 1280*1280。总像素在 [768*768, 1280*1280] (即589824 至 1638400像素点)之间,且宽高比范围为 [1:4, 4:1]。例如,768*2700符合要求。

示例值:1280*1280。

常见比例推荐的分辨率

  • 1:1:1280*1280 或 1024*1024

  • 2:3:800*1200

  • 3:2:1200*800

  • 3:4:960*1280

  • 4:3:1280*960

  • 9:16:720*1280

  • 16:9:1280*720

  • 21:9:1344*576

输出图像尺寸的规则

方式一:指定 size 参数:输出图像严格按 size 指定的宽高生成。

方式二:未指定 size:输出图像由 总像素上限 和 宽高比规则 共同决定。系统会根据总像素并安装宽高比规则对图像进行处理后输出。

  • 总像素规则:由 enable_interleave 控制。

    • enable_interleave=true 时:

      • 若输入图像总像素 ≤ 1280*1280,输出总像素与输入一致;

      • 若输入图像总像素 > 1280*1280,输出总像素固定为 1280*1280。

    • enable_interleave=false 时:输出总像素固定为 1280*1280。

  • 宽高比规则(近似):

    • 单图输入:输出宽高比与输入图像一致;

    • 多图输入:输出宽高比与最后一张输入图像一致。

示例:当 enable_interleave=true 且输入 1 张 720×720 的图像时,输出图像为 720×720,宽高比与输入一致。

max_images integer (可选)

仅在 图文混合生成模式(即 enable_interleave=true)下生效。
用于指定模型最多生成的图像数量,取值范围:1~5,默认值:5。

注意:该参数表示上限,实际生成数量可能少于设定值(例如设置为 5,可能仅返回 3 张图像),具体取决于模型推理结果。

enable_interleave bool (可选)

控制生图模式:

  • false:默认值,表示图像编辑模式(支持多图输入及主体一致性生成)。

    • 用途:基于13张输入图像进行编辑、风格迁移或主体一致性生成。

    • 输入:必须提供至少1张参考图像。

    • 输出:可生成14张结果图像。

  • true :表示启用图文混排输出模式(仅支持传入一张图像或不传图像)。

    • 用途:根据文本描述生成图文并茂的内容,或进行纯文本生成图像(文生图)。

    • 输入:可以不提供图像(文生图),或提供最多1张参考图像。

    • 输出:固定生成1个包含文本和图像的混合内容块。

prompt_extend bool (可选)

是否开启prompt智能改写。开启后,将使用大模型优化正向提示词,对描述性不足、较为简单的prompt有明显提升效果,但会增加3-4秒耗时。

生效条件:仅在 enable_interleave=false 时生效,该功能不适用于图文混排模式。

可选值:

  • true:默认值,开启智能改写。

  • false:不开启智能改写。

n integer (可选)

重要

n直接影响费用。费用 = 单价 × 图片张数。

生成图片的数量。取值根据模式动态设定:

  • enable_interleave=true 时,固定为1。

  • enable_interleave=false 时,取值范围为1~4张,默认值为4。

测试阶段建议设置为1,方便低成本验证。

watermark bool (可选)

是否添加水印标识,水印位于图片右下角,文案固定为“AI生成”。

  • false:默认值,不添加水印。

  • true:添加水印。

seed integer (可选)

随机数种子,取值范围[0,2147483647]

使用相同的seed参数值可使生成内容保持相对稳定。若不提供,算法将自动使用随机数种子。

注意:模型生成过程具有概率性,即使使用相同的seed,也不能保证每次生成结果完全一致。

响应参数

成功响应

请保存 task_id,用于查询任务状态与结果。

{
    "output": {
        "task_status": "PENDING",
        "task_id": "0385dc79-5ff8-4d82-bcb6-xxxxxx"
    },
    "request_id": "4909100c-7b5a-9f92-bfe5-xxxxxx"
}

异常响应

创建任务失败,请参见错误信息进行解决。

{
    "code":"InvalidApiKey",
    "message":"Invalid API-key provided.",
    "request_id":"fb53c4ec-1c12-4fc4-a580-xxxxxx"
}

output object

任务输出信息。

属性

task_id string

任务ID。查询有效期24小时。

task_status string

任务状态。

枚举值

  • PENDING:任务排队中

  • RUNNING:任务处理中

  • SUCCEEDED:任务执行成功

  • FAILED:任务执行失败

  • CANCELED:任务已取消

  • UNKNOWN:任务不存在或状态未知

request_id string

请求唯一标识。可用于请求明细溯源和问题排查。

code string

请求失败的错误码。请求成功时不会返回此参数,详情请参见错误信息

message string

请求失败的详细信息。请求成功时不会返回此参数,详情请参见错误信息

步骤2:根据任务ID查询结果

北京地域GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}

新加坡地域GET https://dashscope-intl.aliyuncs.com/api/v1/tasks/{task_id}

说明
  • 轮询建议:图像生成过程约需数分钟,建议采用轮询机制,并设置合理的查询间隔(如 10 秒)来获取结果。

  • 任务状态流转:PENDING(排队中)→ RUNNING(处理中)→ SUCCEEDED(成功)/ FAILED(失败)。

  • 结果链接:任务成功后返回图像链接,有效期为 24 小时。建议在获取链接后立即下载并转存至永久存储(如阿里云 OSS)。

  • QPS 限制:查询接口默认QPS20。如需更高频查询或事件通知,建议配置异步任务回调

  • 更多操作:如需批量查询、取消任务等操作,请参见管理异步任务

请求参数

查询任务结果

请将86ecf553-d340-4e21-xxxxxxxxx替换为真实的task_id。

curl -X GET https://dashscope.aliyuncs.com/api/v1/tasks/86ecf553-d340-4e21-xxxxxxxxx \
--header "Authorization: Bearer $DASHSCOPE_API_KEY"
请求头(Headers)

Authorization string(必选)

请求身份认证。接口使用阿里云百炼API-Key进行身份认证。示例值:Bearer sk-xxxx。

URL路径参数(Path parameters)

task_id string(必选)

任务ID。

响应参数

任务执行成功

任务数据(如任务状态、图像URL等)仅保留24小时,超时后会被自动清除。请您务必及时保存生成的图像。

{
    "request_id": "43d9e959-25bc-4dc7-9888-xxxxxx",
    "output": {
        "task_id": "858cad55-4bdc-4ba3-ae6c-xxxxxx",
        "task_status": "SUCCEEDED",
        "submit_time": "2025-12-16 04:21:02.275",
        "scheduled_time": "2025-12-16 04:21:02.304",
        "end_time": "2025-12-16 04:24:46.658",
        "finished": true,
        "choices": [
            {
                "finish_reason": "stop",
                "message": {
                    "role": "assistant",
                    "content": [
                        {
                            "image": "https://dashscope-result-bj.oss-cn-beijing.aliyuncs.com/1xxx.png?Expires=xxx",
                            "type": "image"
                        }
                    ]
                }
            },
            {
                "finish_reason": "stop",
                "message": {
                    "role": "assistant",
                    "content": [
                        {
                            "image": "https://dashscope-result-bj.oss-cn-beijing.aliyuncs.com/1xxx.png?Expires=xxx",
                            "type": "image"
                        }
                    ]
                }
            }
        ]
    },
    "usage": {
        "size": "1280*1280",
        "total_tokens": 0,
        "image_count": 2,
        "output_tokens": 0,
        "input_tokens": 0
    }
}

任务执行异常

如果因为某种原因导致任务执行失败,将返回相关信息,可以通过codemessage字段明确指示错误原因。请参见错误信息进行解决。

{
    "request_id": "a4d78a5f-655f-9639-8437-xxxxxx",
    "code": "InvalidParameter",
    "message": "num_images_per_prompt must be 1"
}

output object

任务输出信息。

属性

task_id string

任务ID。查询有效期24小时。

task_status string

任务状态。

枚举值

  • PENDING:任务排队中

  • RUNNING:任务处理中

  • SUCCEEDED:任务执行成功

  • FAILED:任务执行失败

  • CANCELED:任务已取消

  • UNKNOWN:任务不存在或状态未知

轮询过程中的状态流转:

  • PENDING(排队中) → RUNNING(处理中)→ SUCCEEDED(成功)/ FAILED(失败)。

  • 初次查询状态通常为 PENDING(排队中)或 RUNNING(处理中)。

  • 当状态变为 SUCCEEDED 时,响应中将包含生成的图像url。

  • 若状态为 FAILED,请检查错误信息并重试。

submit_time string

任务提交时间。格式为 YYYY-MM-DD HH:mm:ss.SSS。

scheduled_time string

任务执行时间。格式为 YYYY-MM-DD HH:mm:ss.SSS。

end_time string

任务完成时间。格式为 YYYY-MM-DD HH:mm:ss.SSS。

finished bool

请求结束标志符。

  • true:表示请求结束。

  • false:表示请求还未结束。

choices array of object

模型生成的输出内容。

属性

finish_reason string

任务停止原因,自然停止时为stop

messages object

模型返回的消息。

属性

role string

消息的角色,固定为assistant

content array

属性

image string

生成图像的 URL,图像格式为PNG。链接有效期为24小时,请及时下载并保存图像。

type string

输出的类型,枚举值为image、text。

usage object

输出信息统计。只对成功的结果计数。

属性

image_count integer

生成图像的张数。

size string

生成的图像分辨率。示例值:1328*1328。

input_tokens integer

输入token数量。按图片张数计费,当前固定为0。

output_tokens integer

输出token数量。按图片张数计费,当前固定为0。

total_tokens integer

token数量。按图片张数计费,当前固定为0。

request_id string

请求唯一标识。可用于请求明细溯源和问题排查。

code string

请求失败的错误码。请求成功时不会返回此参数,详情请参见错误信息

message string

请求失败的详细信息。请求成功时不会返回此参数,详情请参见错误信息

使用限制

  • 数据时效:任务task_id和 图像url均只保留 24 小时,过期后将无法查询或下载。

  • 内容审核:输入的 prompt 和输出的图像均会经过内容安全审核,包含违规内容的请求将报错“IPInfringementSuspect”或“DataInspectionFailed”,具体参见错误信息

  • 网络访问配置:图像链接存储于阿里云 OSS,如果业务系统因安全策略无法访问外部OSS链接,请将以下 OSS 域名加入网络访问白名单。

    # OSS域名列表
    dashscope-result-bj.oss-cn-beijing.aliyuncs.com
    dashscope-result-hz.oss-cn-hangzhou.aliyuncs.com
    dashscope-result-sh.oss-cn-shanghai.aliyuncs.com
    dashscope-result-wlcb.oss-cn-wulanchabu.aliyuncs.com
    dashscope-result-zjk.oss-cn-zhangjiakou.aliyuncs.com
    dashscope-result-sz.oss-cn-shenzhen.aliyuncs.com
    dashscope-result-hy.oss-cn-heyuan.aliyuncs.com
    dashscope-result-cd.oss-cn-chengdu.aliyuncs.com
    dashscope-result-gz.oss-cn-guangzhou.aliyuncs.com
    dashscope-result-wlcb-acdr-1.oss-cn-wulanchabu-acdr-1.aliyuncs.com

计费与限流

  • 模型免费额度和计费单价请参见模型列表

  • 模型限流请参见通义万相

  • 计费说明:

    • 按成功生成的 图像张数 计费。仅当查询结果接口返回task_statusSUCCEEDED 并成功生成图像后,才会计费。

    • 模型调用失败或处理错误不产生任何费用,也不消耗免费额度

错误码

如果模型调用失败并返回报错信息,请参见错误信息进行解决。

常见问题

Q: 如何查看模型调用量?

A: 模型调用完一小时后,请在模型观测页面,查看模型的调用次数、成功率等指标。如何查看模型调用记录?