一句话实现多样化图像编辑。通义万相-通用图像编辑模型通过简单的文本指令,即可完成扩图、去水印、风格迁移、图像修复、图像美化等多种图像编辑任务,让创意触手可及。
模型概览
模型名称 | 计费单价 | 限流(主账号与RAM子账号共用) | 免费额度 | |
任务下发接口RPS限制 | 同时处理中任务数量 | |||
wanx2.1-imageedit | 0.14元/张 | 2 | 2 | 免费额度:500张 有效期:阿里云百炼开通后180天内 |
更多说明请参见模型计费与限流。
前期准备
通义万相-通用图像编辑API目前仅支持通过HTTP进行调用。
您需要已获取API Key并配置API Key到环境变量。
关键能力
通义万相-图像编辑模型支持多种常用图像编辑功能,通过设置function
(编辑功能)和prompt
(提示词)即可实现一句话处理图像。具体参数说明可在通用图像编辑API参考中查看。
功能类别 | 功能描述 |
图像风格化 | |
图像内容编辑 | |
图像尺寸与分辨率优化 | |
图像色彩处理 |
|
基于参考图像生成 |
您可以结合多个功能灵活处理图像需求。以下是一些典型场景,供您参考,请根据实际业务需求选择合适的功能组合。
海报素材生成:去文字水印 → 图像超分(提升图像分辨率) → 扩图(适配海报尺寸要求)。
老照片修复:去文字水印 → 图像上色(为黑白老照片添加色彩) → 图像超分(提升分辨率,用于高清展示)。
全局风格化
您可将参数function
设置为stylization_all
,表示启用全局风格化功能。该功能根据指定风格对整张图像进行风格迁移。目前支持两种风格:
法国绘本风格
金箔艺术风格
使用场景:绘本创作、社交媒体配图(生成符合特定视觉风格的背景或概念图)等。
提示词技巧:提示词推荐写为“转换成xx风格”,例如“转换成法国绘本风格”或“转换成金箔艺术风格”。
输入图像 | 输出图像 | |
提示词:转换成法国绘本风格 | 提示词:转换成金箔艺术风格 | |
| ||
控制图像修改幅度
通过parameters.strength
参数来控制图像修改幅度。该参数为可选值,取值范围为[0.0, 1.0],默认值为0.5。值越接近0,则越接近原图效果;值越接近1,对原图的修改幅度越大。
输入提示词:转换成法国绘本风格。
输入图像 | 输出图像 | ||
strength=0.0(最小值) | strength=0.5(默认值) | strength=1.0(最大值) | |
局部风格化
您可将参数function
设置为stylization_local
,表示启用局部风格化功能。该功能根据指定风格对图像的局部区域进行风格迁移,目前支持八种风格,具体中英文对照如下:
冰雕:ice
云朵:cloud
花灯:chinese festive lantern
木板:wooden
青花瓷:blue and white porcelain
毛茸茸:fluffy
毛线:weaving
气球:balloon
使用场景:个性化定制 (仅对人物、背景等特定区域进行风格化)、广告设计 (突出某个商品或元素的艺术风格)等。
提示词技巧:提示词推荐写为“把xx变成xx风格”。
输入提示词:把房子变成冰雕风格。
输入图像 | 输出图像 | |||
原图
| 冰雕 | 云朵 | 花灯 | 木板 |
青花瓷 | 毛茸茸 | 毛线 | 气球 |
指令编辑
您可将参数function
设置为description_edit
,表示启用指令编辑功能。该功能通过指令即可完成增加或修改操作。与局部重绘不同的是,指令编辑无需指定区域,更适合无需严格定位编辑区域的场景,例如全局调整或粗略修改等操作。
使用场景:个人形象装扮,比如增加配饰(如戴墨镜/戴耳环)、换发色等。
提示词技巧:提示词推荐显式写明“添加”、“修改”这类操作描述。
添加元素
输入提示词:给小猫添加一副墨镜。
输入图像 | 输出图像 |
修改元素
输入提示词:把女孩的头发修改为红色。
输入图像 | 输出图像 |
控制图像修改幅度
通过parameters.strength
参数来控制图像修改幅度。该参数为可选值,取值范围为[0.0, 1.0],默认值为0.5。值越接近0,则越接近原图效果;值越接近1,对原图的修改幅度越大。
输入提示词:将女孩穿的衣服修改为彩色印花的沙滩衬衣。
输入图像 | 输出图像 | ||
strength=0.0(最小值) | strength=0.5(默认值) | strength=1.0(最大值) | |
局部重绘
您可将参数function
设置为description_edit_with_mask
,表示启用局部重绘功能。该功能支持对图像指定区域的元素进行增加、修改或删除操作。
使用场景:换装(如修改衣服颜色)、替换某个局部物件(如桌上的茶杯替换为花瓶)、删除干扰物(如旅游照的遮挡物)等。
提示词技巧:针对增加或修改
操作,您可通过以下两种方式描述提示词。
方式一:描述具体动作,例如“给小狗添加一顶帽子”。
方式二:客观描述期望生成的内容,例如“一只戴着帽子的小狗”。
针对删除
操作,需根据实际情况分类处理:
删除占据图片空间较少的元素时,提示词可留空(
prompt=""
)。删除占据图片空间较大的元素时,需详细描述擦除后的内容,例如“一个透明玻璃花瓶放在桌子上”,而非简单描述为“删除xxx”。
示例效果展示
增加元素
输入提示词:给小狗添加一顶帽子。
提示词也可以写为“一只戴着帽子的小狗”(描述期望的图像内容)。
输入图像 | 输入涂抹区域图像(白色为涂抹区域) | 输出图像 |
修改元素
输入提示词:一只陶瓷兔子抱着一朵陶瓷花。
提示词也可以写为“将陶瓷兔子抱着的胡萝卜换做陶瓷花”(描述动作)。
输入图像 | 输入涂抹区域图像(白色为涂抹区域) | 输出图像 |
删除元素
输入提示词:一个透明玻璃花瓶放在桌子上。
提示词需要描述擦除后的内容,不要写为“删除一只棕色的小熊”。
输入图像 | 输入涂抹区域图像(白色为涂抹区域) | 输出图像 |
去文字水印
您可将参数function
设置为remove_watermark
,表示启用去文字水印功能。该功能可有效去除图像中的文字(中英文)及水印。
使用场景:图像二次处理(去除文字干扰)、广告设计(去除品牌水印标识)等。
提示词技巧:提示词推荐写为“去除图像中的文字”或者描述要去除的文字类型,比如“去除英文文字”。
输入提示词:去除图像中的文字。
输入图像 | 输出图像 |
扩图
您可将参数function
设置为expand
,表示启用扩图功能。该功能支持对图像在上、下、左、右四个方向按比例扩图。
使用场景:海报设计(将竖图扩为横版以适应封面尺寸)、摄影二次构图(扩展背景后重新调整主体位置)等。
提示词技巧:提示词需要描述扩图后的图片内容。
输入提示词:一家人在公园草坪上。
输入图像 | 输出图像 |
图像超分
您可将参数function
设置为super_resolution
,表示启用图像超分功能。该功能支持高清放大,能够将模糊或低分辨率图像转化为清晰、高分辨率的图像,同时在放大过程中增强图像细节。
关键参数: upscale_factor
,用于控制图像的放大倍数,取值范围为 1~4,默认值为 1。当 upscale_factor=1
时,仅提升图像清晰度,不进行放大处理。
使用场景:老旧照片修复、图像高清打印(将小尺寸图片放大到高分辨率)等。
提示词技巧:提示词推荐写为“图像超分”或描述超分后的图片。
输入提示词:图片超分。
输入图像(模糊图像) | 输出图像(清晰图像) |
图像上色
您可将参数function
设置为colorization
,表示启用图像上色功能。该功能支持将黑白或灰度图像转化为彩色图像(黑白/灰度 → 彩色)。
使用场景:历史照片还原、儿童绘本上色等。
提示词技巧:在提示词中可指定颜色(如“蓝色背景,黄色叶子”)。若未指定颜色,模型将自动选择适合的颜色。
输入提示词:蓝色背景,黄色的叶子。
输入图像 | 输出图像 |
线稿生图
您可将参数function
设置为doodle
,表示启用线稿生图功能。该功能默认会从输入的 RGB 图像中提取线稿,然后基于线稿和提示词生成图像(RGB图像 → 线稿 → 新图)。
使用场景:建筑概念设计、插画设计、涂鸦作画等。
提示词技巧:提示词应详细描述期望生成的图像内容,描述越具体,生成效果越好。
输入提示词:北欧极简风格的客厅。
输入图像 | 输出图像 |
设置is_sketch=true
支持涂鸦作画
parameters.is_sketch
参数用来设置输入图像是否为线稿图像。
该参数为可选值,默认值为false
,表示输入图像不为线稿图像。模型会先从输入图像提取线稿,然后基于提取的线稿生成新图像。若为true
,表示输入图像为线稿图像。模型将直接基于输入图像生成图像,适用于涂鸦作画场景。
如果输入图像是涂鸦线稿图,设置 is_sketch=true
实现涂鸦作画,如下所示。
输入提示词:一颗树,二次元动漫风格。
输入图像(涂鸦线稿图) | 输出图像 | |
is_sketch=true(根据涂鸦作画) | is_sketch=false(先提取线稿再作画) | |
参考卡通形象生图
您可将参数function
设置为control_cartoon_feature
,表示启用参考卡通形象生图功能。
使用场景:适用于卡通IP开发 (基于已有卡通形象生成新场景)、儿童教育 (为儿童读物或教育材料生成卡通插图)等。
提示词技巧:提示词需详细描述卡通形象的行动,建议采用格式“卡通形象……”,描述越具体,生成效果越好。
输入提示词:卡通形象小心翼翼地探出头,窥视着房间内一颗璀璨的蓝色宝石。
输入图像 | 输出图像 |
API 参考
关于通义万相-通用图像编辑模型的输入与输出参数,请参见通用图像编辑API参考。