智能抠图

更新时间:
复制 MD 格式

智能抠图自动识别图像中的显著性主体,将主体和背景进行分离,返回去除背景后的主体图片。同时提供多种背景选项及定制尺寸选择,优化商品展示效果。同步调用。

适用场景

  • 支持对素材进行二次编辑:将图像主体和背景进行分离后,可支持用户进一步对图片的二次编辑。

  • 提高素材处理效率:快速提取各类素材图片主体,方便进行背景替换,从而提高广告形象、营销海报的制作效率。

如果需要把抠图与翻译、消除、扩展等多项处理一次性串联,建议通过智能出图编排,本接口提供独立的原子能力。

功能介绍

1. 一键精准主体识别

  • AI 自动识别:基于深度学习模型,智能区分前景主体(人像、商品、物体等)与背景,无需手动描边。

  • 多场景适配:支持复杂场景(如发丝、透明物体、毛发边缘)的精准分割,准确率超 95%。

2. 边缘智能优化

  • 细节级处理:自动优化边缘锯齿、半透明区域(如烟雾、玻璃),保留自然过渡效果。

3. 多格式输出与背景操作

  • 透明背景导出:直接生成 PNG 透明底图和白底图,适配电商、设计等场景。

  • 支持对背景自定义背景颜色

效果对比

原始图片(输入)

结果图片(输出)

image

image

image

image

image

image

接口

POST /rest/ai/image/matting

请求参数

参数

类型

必填

说明

backGroundType

String

返回图像的背景形式:WHITE_BACKGROUND(白底)、TRANSPARENT(透明 PNG)。如需自定义背景色,请在此基础上同时传 BgColor

ImageUrl

String

原图 URL。要求:JPG / JPEG / PNG / BMP / WEBP 格式;分辨率在 100×100 至 3000×3000 像素之间;文件 ≤ 10 MB。

TargetWidth

Number

期望输出宽度,单位像素,取值 100-5000。设置后服务端会自动裁切主体边缘空白区域并缩放;不传则保留原图宽度,不改变主体位置。

TargetHeight

Number

期望输出高度,单位像素,取值 100-5000。设置后服务端会自动裁切主体边缘空白区域并缩放;不传则保留原图高度,不改变主体位置。

BgColor

String

自定义背景 BGR 三元组(注意是 BGR 不是 RGB),逗号分隔,如 "255,255,255" 表示白色,"0,0,255" 表示红色。默认白色。仅当需要非白底纯色背景时传入。

响应字段

字段

类型

说明

Code

String

业务状态码。成功为 Success

RequestId

String

请求唯一标识,排查问题时联系技术支持需提供。

Message

String

信息。成功时为 "Success"

Success

Boolean

本次调用是否成功。

Data

Object

返回的结果结构体信息。

Data.ImageUrl

String

处理后的结果图片 URL(OSS 签名链接)。BackGroundType=TRANSPARENT 时为透明 PNG,白底/自定义背景色时为对应底图。

Data.Score

Number

图像质量评分,越大越可信。

Data.Width

Number

输出图像宽度(像素)。

Data.Height

Number

输出图像高度(像素)。

Data.UsageMap

Object

用量字段。

Data.UsageMap.ProcessedImageCount

Number

已处理图片数量。

完整示例

请求示例

{
  "ImageUrl": "https://sc02.alicdn.com/kf/H09364d2c7fc942e685d3b0f656261b24Q.png",
  "BackGroundType": "WHITE_BACKGROUND",
  "TargetWidth": 800,
  "TargetHeight": 800,
  "BgColor": "255,255,255"
}

响应示例

{
  "Data": {
    "ImageUrl": "https://oss.aliyuncs.com/.../matting-result.jpg",
    "Score": 5.959999978542328,
    "Height": 800,
    "Width": 800,
    "UsageMap": { "ProcessedImageCount": 1 }
  },
  "RequestId": "e7f920e2-4aac-9946-bf2d-861b68ff31ba",
  "Message": "Success",
  "Code": "success",
  "Success": true
}

使用建议

  • 透明底 vs 白底的选择:电商主图要求白底时直接传 WHITE_BACKGROUND;后续要做二次合成(如换营销背景)时建议传 TRANSPARENT,由客户端自行合成更灵活。

  • 分辨率与质量:源图分辨率越接近 3000×3000 上限,发丝 / 透明物体的边缘还原越细腻;过小(如 100×100)的图建议先做高清放大再抠图。

  • 颜色编码顺序BgColor 使用 BGR 顺序而非常见的 RGB,移植 OpenCV 之外的代码时务必转换。

  • Score 质量评分Score 偏低时通常源图复杂度过高(如纯色商品贴在纯色背景上),建议人工复核或更换源图。

错误码

错误码

触发场景

InvalidParameter

ImageUrl 为空 / 图片格式或分辨率不在范围 / BgColor 不是合法 BGR 三元组。

InputContentBlocked

输入图片触发内容安全审核。

DownstreamUnavailable

图片下载失败 / 下游视觉模型暂时不可用。建议指数退避后重试。

FreeQuotaExhausted

试用额度已耗尽,需购买商品包或关闭"用完即停"。

InternalError

服务端内部错误。请保留 RequestId 联系技术支持。

完整错误码列表参见错误码

使用限制

  • 调用模式:同步。默认 QPS = 5,单次请求超时上限 30 秒。

  • 输入图片:JPG / JPEG / PNG / BMP / WEBP;分辨率 100×100 至 3000×3000;文件 ≤ 10 MB。

  • 输出:白底/自定义背景色为 JPG,透明背景为 PNG(含透明通道),结果通过 Data.ImageUrl(OSS 签名链接)返回,链接有效期通常 7 天。

  • 计费¥0.002/张,按 ProcessedImageCount 计件。详见素材优化计费。

常见问题

智能抠图在不同类型图片上的效果有什么差异?

在主体占比大、完整、单主体或多个明确主体的电商商品主图上表现更好;对透明等特殊材质、主体不明确的图片(如使用步骤图、局部细节图、SKU 拼图)会有一定程度的偏差或错误。

抠图后主体的像素、质量会下降吗?

不会。不填入目标宽高时,结果返回原图尺寸,不影响抠出主体的质量;若设置了目标宽高且与原图尺寸不一致,结果返回目标尺寸并对主体做缩放等处理,当目标尺寸与原图差距过大时可能影响质量。

后续步骤

  • 智能出图 -- 将抠图与其余 6 项视觉能力一次性编排为异步任务。

  • 智能消除 -- 抠图前先去除水印 / Logo / 文字干扰元素。

  • 智能裁剪 -- 抠图后按主体智能裁剪为目标尺寸。