尺码图提取

更新时间:
复制 MD 格式

基于多模态大模型从图片中提取尺码表结构化数据,自动识别尺码、衣长、肩宽、胸围、体重建议等列,附带单位(cm / kg)与上下限值。可指定要识别的列名清单和输出语言(中 / 英)。异步调用(提交 + 查询)。

定位与适用场景

尺码图提取专为服饰、鞋包、首饰类目设计。这些类目的尺码表通常以图片形式嵌在商品详情中,跨境上架时无法直接被目标平台读取。本接口把图片里的尺码表"翻译"成结构化 JSON,下游可直接用于:

  • TEMU / Amazon 等平台必填属性:自动填充"建议体重 40-47.5 kg"、"裙长 81 cm"等结构化属性。

  • 多语言尺码表本地化:用 LanguageModel 直接产出英文尺码表,省去再调翻译接口。

  • 批量服饰商品入库:与尺码图检测组合,先快速判断"是否含尺码图",含的才走本接口提取,避免无谓计费。

接口

本接口为异步:提交后拿 TaskId,再轮询查询接口。

提交提取任务

POST /rest/ai/sizeChart/extract

查询提取结果

POST /rest/ai/task/queryTaskResult

请求参数(提交接口)

参数

类型

必填

说明

ImageUrl

String

尺码图的 URL。要求:JPG / JPEG / PNG / BMP / WEBP 格式;分辨率 256×256 至 3000×3000;文件 ≤ 10 MB。

ColumnNameList

String[]

指定要识别的列名清单(白名单)。不传则全列识别;传入后只输出命中的列,降低噪声。常用 26 列:SizeBustLengthShoulderSleeveWeightBack LengthCuffSleeve WidthWaistOutseamInseamGarment LengthHipInside DiameterRing SizeInside CircumferenceRing Size NumberBand WidthChain LengthThicknessWidthHeightUpper WidthLower WidthDepth

LanguageModel

String

输出语言:cn 中文、en 英文。 目前仅支持原图为中文或英文时,该语言指定生效。若原图为其他语言,输出图则为原图语言。

请求参数(查询接口)

参数

类型

必填

说明

TaskId

String

提交接口返回的任务 ID。任务有效期 24 小时。

响应字段

提交接口响应

字段

类型

说明

Code

String

业务状态码。成功为 Success

Success

Boolean

是否成功:true 代表成功,false 代表失败。

RequestId

String

请求唯一标识。

Data.TaskId

String

异步任务 ID,用于查询接口。

查询接口响应

查询响应的 Result 部分包含识别出的结构化尺码表数据。容器字段采用 PascalCase(如 SizeChartSizeChartAttributesIntersectionAttributes);每个属性对象内部的取值字段为小写 value / unit,区间值额外含 upper_value / lower_value。属性名(如 Size、Bust)为动态字段,取决于尺码表内容与 LanguageModelData.Result 为对象(Object),可直接读取,无需二次解析。

字段

类型

说明

Data.Status

String

任务状态:QUEUED(排队中)/ IN_PROGRESS(执行中)/ COMPLETED(已完成)/ FAILED(失败)。

Data.TaskId

String

异步任务 ID。

Data.Result.Message

Object

Message 为对象,以原始图片 URL 作 key(支持单提交多图扩展);各 Data.Result.Message.<url>.* 为对应图片的识别结构,可直接读取。

Data.Result.Message.<url>.SizeChart

Object[]

每个尺码档位一行。属性名为动态字段(如 Size、Bust),每个属性是一个对象,含小写 value(值)、unit(单位,如 CM / kg)、upper_value / lower_value(上下限,用于体重建议等区间值)。

Data.Result.Message.<url>.IntersectionAttributes

String[]

语言翻译后的属性名列表(如果翻译不生效,则与原始提取到的属性名列表一致)。

Data.Result.Message.<url>.SizeChartAttributes

String[]

原始提取到的属性名列表。

Data.UsageMap.ProcessedImageCount

Number

本次已处理图片张数,用于计费。

完整示例

提交请求示例

{
  "ImageUrl": "https://example.com/dress-size-chart.png",
  "ColumnNameList": ["Size", "Bust", "Length", "Weight"],
  "LanguageModel": "en"
}

查询响应示例

{
  "Code": "success",
  "Message": "Success",
  "Success": true,
  "RequestId": "21570000-0000-0000-0000-000000000003",
  "Data": {
    "TaskId": "c657386a-f39e-9888-8570-1ca8b4603c19",
    "Status": "COMPLETED",
    "Result": {
      "Message": {
        "https://example.com/dress-size-chart.png": {
          "SizeChart": [
            {
              "Size":   { "value": "S" },
              "Bust":   { "unit": "cm", "value": 84 },
              "Length": { "unit": "cm", "value": 81 },
              "Weight": { "unit": "kg", "upper_value": 47.5, "lower_value": 40 }
            },
            {
              "Size":   { "value": "M" },
              "Bust":   { "unit": "cm", "value": 88 },
              "Length": { "unit": "cm", "value": 82 },
              "Weight": { "unit": "kg", "upper_value": 55,   "lower_value": 47.5 }
            }
          ],
          "IntersectionAttributes": ["Size", "Bust", "Length", "Weight"],
          "SizeChartAttributes":   ["Size", "Bust", "Length", "Weight"]
        }
      }
    },
    "UsageMap": { "ProcessedImageCount": 1 }
  }
}

使用建议

  • 先检测再提取:批量场景下先调尺码图检测过滤掉非尺码图,再走本接口,可减少 60-80% 的无效计费。

  • 列名白名单:电商类目通常只需要 5-8 列。指定 ColumnNameList 能避免模型把"备注""偏小"等说明列识别为属性。

  • 体重 / 适用身高列:通常是区间值,会拆为 upper_value + lower_value;普通尺寸列是单值,用 value。客户端需做兼容判断。

  • 轮询节奏:典型任务 10-30 秒完成。建议轮询间隔 5 秒,最多等 5 分钟。

错误码

错误码

触发场景

InvalidParameter

ImageUrl 无法访问 / 格式不符 / LanguageModel 不在 cn|en 范围。

InputContentBlocked

输入图片触发内容安全审核。

DownstreamUnavailable

图片下载失败 / 下游大模型暂时不可用。建议指数退避后重试。

OutputContentBlocked

模型输出触发安全审核。极少出现。

FreeQuotaExhausted

试用额度已耗尽。

InternalError

服务端内部错误。请保留 RequestId 联系技术支持。

完整错误码列表参见错误码

使用限制

  • 调用模式:异步。查询接口无 QPS 限制,建议轮询间隔 ≥ 5 秒。提交接口默认 QPS = 2、单次请求超时上限 30 秒,详见频率限制

  • 处理时长:单图典型 10-30 秒完成,复杂尺码图(多分组、多语言)耗时略长。任务有效期 24 小时。

  • 输入图片:JPG / JPEG / PNG / BMP / WEBP;分辨率 256×256 至 3000×3000;文件 ≤ 10 MB。

  • 字段命名:响应 Result 部分沿用模型原始 snake_case,外层 Code / RequestId / Data.TaskId / Data.Status 仍是 PascalCase。

  • 计费¥0.03/张,按 ProcessedImageCount 计件。详见素材优化计费。

常见问题

什么场景下会用到尺码图提取能力?

当经营的类目需要在平台上提交或获取尺码信息,而手头只有原始商品素材中的尺码图(图片形式)时,可用本能力把图片中的尺码表转为结构化文本。

相比直接用 OCR,本能力的优势在哪里?

① 可由用户自主选择要提取的列(ColumnNameList);② 能帮助过滤掉无需提取的图片(配合尺码图检测),节省不必要的调用成本。

后续步骤

  • 尺码图检测 -- 批量场景下先做布尔检测,再走本接口提取。

  • 商品素材优化 Pro -- 服饰类目下 Pro 工作流会自动调用本接口产出尺码表字段。