图片翻译Pro版

更新时间:
复制为 MD 格式

图片翻译 Pro 版基于自研多模态大模型,对图片实现更精准的语义理解,显著提升翻译质量,支持源语言自动识别与编辑器布局信息返回(可用于二次编辑),支持 100 多种(含桥接)语向。统一入口,支持同步与异步两种调用模式(由 Async 字段选择)。

产品简介

图片翻译 Pro 版产品专为电商图片设计,融合多模态大模型技术,实现对图片的更精准理解,显著提高翻译质量,并不断扩展和优化多语言翻译能力。支持 100 多种(含桥接)语向。

适用场景

电商商品图、营销图,以及其他多种场景的图片。

功能介绍

  • 商品主体信息保护:支持自定义选择是否翻译商品主体上的文字,可帮助保护主体信息不被翻译(如商品名称等嵌入信息)。

  • 翻译后可二次编辑:支持自定义选择是否返回文字的位置、字体、颜色等布局信息(UseImageEditor),便于对译文做二次编辑。当前可直接使用返回的布局协议(GenFiles / EditInfo)自行对接;配套的图片编辑器 SDK 本期暂未开放,上线进度请关注平台通知。

  • 品牌名保护:支持自定义选择是否翻译图片上的品牌名,帮助保护品牌名信息,避免被翻译。

  • 支持翻译干预:可自定义翻译结果,包含不被翻译(ABC-ABC)、指定翻译(ABC-DEF)、不翻译(ABC-空值),常用于品牌词保护等场景。调用时传入干预词表 ID 即可生效,一般可上传 10 万条干预词,如需更多可联系平台处理。

接口

统一入口:提交图片 URL 与源/目标语言,由 Async 字段选择同步或异步模式。同步模式直接返回翻译结果;异步模式立即返回 TaskId,再通过查询接口获取结果。开启 UseImageEditor 时额外返回编辑器布局信息。

POST /rest/ai/image/translation/pro

异步结果查询接口

仅当 Async=true 时需要。提交成功后用返回的 TaskId 调用统一的异步查询接口轮询结果,详见异步结果查询接口

POST /rest/ai/task/queryTaskResult

快速开始

import json

data = json.dumps({
    "ImageUrl": "https://img.alicdn.com/.../source.jpg",
    "SourceLanguage": "auto",
    "TargetLanguage": "en",
    "IncludingProductArea": True,
    "TranslatingBrandInTheProduct": True,
    "UseImageEditor": True
})

result = make_signed_request("/rest/ai/image/translation/pro", data)
# 翻译后图片
print(result["Data"]["ResultList"][0]["FileUrl"])
# 编辑器布局信息(UseImageEditor=true 时返回)
print(result["Data"]["GenFiles"][0]["EditInfo"])

请求参数

参数

类型

是否必填

说明

ImageUrl

String

可公网访问的图片 URL。宽与高不超过 4000 x 4000 像素,文件不超过 10 MB。支持 PNG、JPEG、JPG、BMP、WebP。

SourceLanguage

String

源语言代码。支持自动识别(auto)。支持的语向见下方支持的语向。示例 "en"

TargetLanguage

String

目标语言代码。支持的语向见下方支持的语向。示例 "ko"

IncludingProductArea

Boolean

是否翻译商品主体上的文字。默认 false,可保护商品名等嵌入信息。

UseImageEditor

Boolean

是否返回文字的位置、字体、颜色等布局信息,用于二次编辑接入图片编辑器。默认 false。开启后响应额外返回 Data.GenFiles

TranslatingBrandInTheProduct

Boolean

是否翻译图片上的品牌名。默认 false(保留品牌名不翻译)。

Glossary

String

干预词表 ID,用于术语定制。需单独创建并传入其 ID;为空则翻译结果不被干预。

Async

Boolean

调用模式。false=同步(阻塞等待并直接返回结果);true=异步(立即返回 TaskId,通过查询接口获取结果)。默认 false

请求示例

{
  "ImageUrl": "https://img.alicdn.com/imgextra/i3/O1CN01HTDhDi28Fd85ZYs7H_!!6000000007903-0-tps-800-800.jpg",
  "SourceLanguage": "auto",
  "TargetLanguage": "en",
  "IncludingProductArea": true,
  "TranslatingBrandInTheProduct": true,
  "UseImageEditor": true
}

响应字段

响应信封与其他 API 一致:Code / Message / Success / RequestId / Data。响应内容随调用模式不同:同步模式 Data 直接包含结果;异步模式提交响应仅返回 TaskIdStatus,最终结果通过查询接口获取。

同步模式(Async=false)

Data 直接包含翻译结果。翻译结果在 Data.ResultList;用量字段为 Data.UsageMap.ProcessedImageCount(Number);编辑器布局信息在 Data.GenFiles(仅 UseImageEditor=true 时返回)。各字段详见下表。

字段

类型

说明

Data.ResultList

Array[Object]

翻译结果数组。每项含 FileUrl(翻译后图片 URL)与 Language(目标语言代码)。

Data.UsageMap.ProcessedImageCount

Number

已处理图片张数(用量)。

Data.GenFiles

Array[Object]

编辑器协议,仅 UseImageEditor=true 时返回。每项含 SrcImage(原图)、EditInfo(识别的文字区域与布局协议)、ResultList(该原图对应的翻译图)。

Data.GenFiles[].EditInfo

Object

原图编辑器信息,含 ResultImageIds(翻译图全局 Id 集合)、RepairedUrl(擦除原文后的干净底图)、Languages(翻译语种)、TextAreas(文本框列表)、GoodsRects(商品框区域)、Font(字体类型)。

…EditInfo.TextAreas[]

Array[Object]

每个文本框:Content(原文)、FontsizeColorHorizontalLayout(center/left/right)、VerticalLayout(center/top/down)、LineCount,以及 Texts[](译文条目)。

…TextAreas[].Texts[]

Array[Object]

每条译文:Value(译文)、LanguageValidImageRect / TextRect(含 Height/Left/Top/Width/Degree,Degree 为旋转角,<1 为水平)、ColorFontsizeLineCountHorizontalLayoutVerticalLayoutOvisErrMsg(模型时延/报错,如 "| ovis time: 0.748")。

同步响应示例

{
  "Data": {
    "UsageMap": { "ProcessedImageCount": 1 },
    "ResultList": [
      { "Language": "en", "FileUrl": "http://dashscope-a717.oss-cn-beijing.aliyuncs.com/.../0c3f295c-translated.jpg" }
    ],
    "GenFiles": [
      {
        "SrcImage": "https://img.alicdn.com/.../source.jpg",
        "EditInfo": {
          "ResultImageIds": ["0c39c8ae-5820-11f1-bbb2-8281b7a4eed1"],
          "RepairedUrl": "http://dashscope-a717.oss-cn-beijing.aliyuncs.com/.../repaired.png",
          "Languages": ["en"],
          "TextAreas": [
            {
              "Fontsize": 32,
              "Content": "萌趣造型·清脆响铃",
              "Color": "#515151",
              "VerticalLayout": "center",
              "HorizontalLayout": "left",
              "LineCount": 1,
              "Texts": [
                {
                  "Fontsize": 29,
                  "Language": "en",
                  "Valid": true,
                  "ImageRect": { "Height": 54, "Left": 43, "Top": 83, "Width": 418, "Degree": 0 },
                  "TextRect": { "Height": 30, "Left": 8, "Top": 95, "Width": 488, "Degree": 0 },
                  "Color": "#515151",
                  "Value": "Adorable Design · Crisp Bell Sound",
                  "VerticalLayout": "center",
                  "HorizontalLayout": "center",
                  "LineCount": 1,
                  "OvisErrMsg": "| ovis time: 0.748"
                }
              ]
            }
          ],
          "GoodsRects": { "Height": 0, "Left": 0, "Top": 0, "Width": 0, "Degree": 0 },
          "Font": ["AlibabaSans-Regular"]
        },
        "ResultList": [
          { "Language": "en", "FileUrl": "http://dashscope-a717.oss-cn-beijing.aliyuncs.com/.../0c3f295c-translated.jpg" }
        ]
      }
    ]
  },
  "RequestId": "61785C32-80C2-19A3-9E55-2C3702C84B40",
  "Message": "Success",
  "Code": "success",
  "Success": true
}

异步模式(Async=true)提交响应

Data 仅包含 Data.TaskId(String)与 Data.Status(值为 QUEUED)。请凭 TaskId 调用查询接口获取结果。

{
  "Data": {
    "TaskId": "T20260612-7f3a9c2e-0001",
    "Status": "QUEUED"
  },
  "RequestId": "61785C32-80C2-19A3-9E55-2C3702C84B40",
  "Message": "Success",
  "Code": "success",
  "Success": true
}

异步查询响应

通过查询接口轮询。Data.Status 取值 QUEUED / IN_PROGRESS / COMPLETED / FAILED,并回传 Data.TaskId。当 COMPLETED 时,Data.UsageMap / Data.ResultList / Data.GenFiles 与同步模式一致;当 FAILED 时返回 Data.FailReason(String)。

{
  "Data": {
    "TaskId": "T20260612-7f3a9c2e-0001",
    "Status": "COMPLETED",
    "UsageMap": { "ProcessedImageCount": 1 },
    "ResultList": [
      { "Language": "en", "FileUrl": "http://dashscope-a717.oss-cn-beijing.aliyuncs.com/.../0c3f295c-translated.jpg" }
    ],
    "GenFiles": [ ]
  },
  "RequestId": "61785C32-80C2-19A3-9E55-2C3702C84B40",
  "Message": "Success",
  "Code": "success",
  "Success": true
}

翻译支持的语向

语言代码采用 ISO 639-1 两位字母表示法;区域变体遵循 RFC 5646(如繁体中文 zh-tw)。支持桥接翻译,例如 zh-en、en-ar 可组合出 zh-en-ar。Pro 版额外支持源语言自动识别(auto)。

序号

源语言

源代码

目标语言

目标代码

1

中文(简体)

zh

英语

en

2

中文(简体)

zh

日语

ja

3

中文(简体)

zh

韩语

ko

4

阿拉伯语

ar

英语

en

5

阿塞拜疆语

az

英语

en

6

孟加拉语

bn

英语

en

7

捷克语

cs

英语

en

8

德语

de

英语

en

9

希腊语

el

英语

en

10

英语

en

阿拉伯语

ar

11

英语

en

阿塞拜疆语

az

12

英语

en

孟加拉语

bn

13

英语

en

捷克语

cs

14

英语

en

德语

de

15

英语

en

希腊语

el

16

英语

en

西班牙语

es

17

英语

en

芬兰语

fi

18

英语

en

法语

fr

19

英语

en

希伯来语

he

20

英语

en

印地语

hi

21

英语

en

匈牙利语

hu

22

英语

en

印度尼西亚语

id

23

英语

en

意大利语

it

24

英语

en

日语

ja

25

英语

en

韩语

ko

26

英语

en

马来语

ms

27

英语

en

缅甸语

my

28

英语

en

尼泊尔语

ne

29

英语

en

荷兰语

nl

30

英语

en

波兰语

pl

31

英语

en

葡萄牙语(巴西)

pt

32

英语

en

罗马尼亚语

ro

33

英语

en

俄语

ru

34

英语

en

僧伽罗语

si

35

英语

en

瑞典语

sv

36

英语

en

泰语

th

37

英语

en

菲律宾语

tl

38

英语

en

土耳其语

tr

39

英语

en

乌克兰语

uk

40

英语

en

乌尔都语

ur

41

英语

en

越南语

vi

42

英语

en

中文(简体)

zh

43

西班牙语

es

保加利亚语

bg

44

西班牙语

es

捷克语

cs

45

西班牙语

es

丹麦语

da

46

西班牙语

es

德语

de

47

西班牙语

es

希腊语

el

48

西班牙语

es

英语

en

49

西班牙语

es

爱沙尼亚语

et

50

西班牙语

es

芬兰语

fi

51

西班牙语

es

法语

fr

52

西班牙语

es

克罗地亚语

hr

53

西班牙语

es

匈牙利语

hu

54

西班牙语

es

意大利语

it

55

西班牙语

es

立陶宛语

lt

56

西班牙语

es

拉脱维亚语

lv

57

西班牙语

es

荷兰语

nl

58

西班牙语

es

挪威语

no

59

西班牙语

es

波兰语

pl

60

西班牙语

es

葡萄牙语(巴西)

pt

61

西班牙语

es

罗马尼亚语

ro

62

西班牙语

es

俄语

ru

63

西班牙语

es

斯洛伐克语

sk

64

西班牙语

es

瑞典语

sv

65

芬兰语

fi

英语

en

66

法语

fr

英语

en

67

希伯来语

he

英语

en

68

印地语

hi

英语

en

69

匈牙利语

hu

英语

en

70

印度尼西亚语

id

英语

en

71

意大利语

it

英语

en

72

日语

ja

英语

en

73

韩语

ko

英语

en

74

马来语

ms

英语

en

75

缅甸语

my

英语

en

76

尼泊尔语

ne

英语

en

77

荷兰语

nl

英语

en

78

波兰语

pl

英语

en

79

葡萄牙语(巴西)

pt

英语

en

80

罗马尼亚语

ro

英语

en

81

俄语

ru

英语

en

82

僧伽罗语

si

英语

en

83

瑞典语

sv

英语

en

84

泰语

th

英语

en

85

菲律宾语

tl

英语

en

86

土耳其语

tr

阿拉伯语

ar

87

土耳其语

tr

捷克语

cs

88

土耳其语

tr

德语

de

89

土耳其语

tr

希腊语

el

90

土耳其语

tr

英语

en

91

土耳其语

tr

匈牙利语

hu

92

土耳其语

tr

罗马尼亚语

ro

93

乌克兰语

uk

英语

en

94

乌尔都语

ur

英语

en

95

越南语

vi

英语

en

96

中文(繁体)

zh-tw

(桥接)经 zh 中转

zh-tw→zh→…

错误码

图片翻译共享统一的命名错误码体系。本能力常触发以下错误码:

  • InvalidParameter -- 图片尺寸超过 4000 x 4000 像素、文件大小超过 10 MB、或格式不在支持列表(PNG / JPEG / JPG / BMP / WebP)。

  • DownstreamUnavailable -- 图片 URL 无法访问或图片下载异常。

  • InputContentBlocked -- 图片触发内容安全审核。

完整错误码列表及处理建议,请参见错误码

使用限制

  • 调用模式:支持同步与异步,由 Async 字段选择,默认同步。

  • 计费:计费单位为每张,¥0.06/张。

  • 输入图片:分辨率 ≤ 4000 x 4000 像素;文件 ≤ 10 MB;PNG / JPEG / JPG / BMP / WebP;公网可访问。

  • 源语言与目标语言不能相同;支持源语言自动识别(auto)。

  • QPS 上限详见频率限制

兼容性与迁移

场景

行为

存量用户不传 Async

默认 false,与当前同步接口完全一致,零改动。

Async=false

同步调用,等同于不传该字段。

Async=true(不传回调)

异步提交成功,需主动轮询查询接口获取结果。

同步调用超时

建议客户端设置合理超时(推荐 30s),超时场景建议切换异步。

后续步骤