图片翻译Pro版
图片翻译 Pro 版基于自研多模态大模型,对图片实现更精准的语义理解,显著提升翻译质量,支持源语言自动识别与编辑器布局信息返回(可用于二次编辑),支持 100 多种(含桥接)语向。统一入口,支持同步与异步两种调用模式(由 Async 字段选择)。
产品简介
图片翻译 Pro 版产品专为电商图片设计,融合多模态大模型技术,实现对图片的更精准理解,显著提高翻译质量,并不断扩展和优化多语言翻译能力。支持 100 多种(含桥接)语向。
适用场景
电商商品图、营销图,以及其他多种场景的图片。
功能介绍
-
商品主体信息保护:支持自定义选择是否翻译商品主体上的文字,可帮助保护主体信息不被翻译(如商品名称等嵌入信息)。
-
翻译后可二次编辑:支持自定义选择是否返回文字的位置、字体、颜色等布局信息(
UseImageEditor),便于对译文做二次编辑。当前可直接使用返回的布局协议(GenFiles/EditInfo)自行对接;配套的图片编辑器 SDK 本期暂未开放,上线进度请关注平台通知。 -
品牌名保护:支持自定义选择是否翻译图片上的品牌名,帮助保护品牌名信息,避免被翻译。
-
支持翻译干预:可自定义翻译结果,包含不被翻译(ABC-ABC)、指定翻译(ABC-DEF)、不翻译(ABC-空值),常用于品牌词保护等场景。调用时传入干预词表 ID 即可生效,一般可上传 10 万条干预词,如需更多可联系平台处理。
接口
统一入口:提交图片 URL 与源/目标语言,由 Async 字段选择同步或异步模式。同步模式直接返回翻译结果;异步模式立即返回 TaskId,再通过查询接口获取结果。开启 UseImageEditor 时额外返回编辑器布局信息。
POST /rest/ai/image/translation/pro
异步结果查询接口
仅当 Async=true 时需要。提交成功后用返回的 TaskId 调用统一的异步查询接口轮询结果,详见异步结果查询接口。
POST /rest/ai/task/queryTaskResult
快速开始
import json
data = json.dumps({
"ImageUrl": "https://img.alicdn.com/.../source.jpg",
"SourceLanguage": "auto",
"TargetLanguage": "en",
"IncludingProductArea": True,
"TranslatingBrandInTheProduct": True,
"UseImageEditor": True
})
result = make_signed_request("/rest/ai/image/translation/pro", data)
# 翻译后图片
print(result["Data"]["ResultList"][0]["FileUrl"])
# 编辑器布局信息(UseImageEditor=true 时返回)
print(result["Data"]["GenFiles"][0]["EditInfo"])
请求参数
|
参数 |
类型 |
是否必填 |
说明 |
|
|
String |
是 |
可公网访问的图片 URL。宽与高不超过 4000 x 4000 像素,文件不超过 10 MB。支持 PNG、JPEG、JPG、BMP、WebP。 |
|
|
String |
是 |
源语言代码。支持自动识别( |
|
|
String |
是 |
目标语言代码。支持的语向见下方支持的语向。示例 |
|
|
Boolean |
否 |
是否翻译商品主体上的文字。默认 |
|
|
Boolean |
否 |
是否返回文字的位置、字体、颜色等布局信息,用于二次编辑接入图片编辑器。默认 |
|
|
Boolean |
否 |
是否翻译图片上的品牌名。默认 |
|
|
String |
否 |
干预词表 ID,用于术语定制。需单独创建并传入其 ID;为空则翻译结果不被干预。 |
|
|
Boolean |
否 |
调用模式。 |
请求示例
{
"ImageUrl": "https://img.alicdn.com/imgextra/i3/O1CN01HTDhDi28Fd85ZYs7H_!!6000000007903-0-tps-800-800.jpg",
"SourceLanguage": "auto",
"TargetLanguage": "en",
"IncludingProductArea": true,
"TranslatingBrandInTheProduct": true,
"UseImageEditor": true
}
响应字段
响应信封与其他 API 一致:Code / Message / Success / RequestId / Data。响应内容随调用模式不同:同步模式 Data 直接包含结果;异步模式提交响应仅返回 TaskId 与 Status,最终结果通过查询接口获取。
同步模式(Async=false)
Data 直接包含翻译结果。翻译结果在 Data.ResultList;用量字段为 Data.UsageMap.ProcessedImageCount(Number);编辑器布局信息在 Data.GenFiles(仅 UseImageEditor=true 时返回)。各字段详见下表。
|
字段 |
类型 |
说明 |
|
|
Array[Object] |
翻译结果数组。每项含 |
|
|
Number |
已处理图片张数(用量)。 |
|
|
Array[Object] |
编辑器协议,仅 |
|
|
Object |
原图编辑器信息,含 |
|
|
Array[Object] |
每个文本框: |
|
|
Array[Object] |
每条译文: |
同步响应示例
{
"Data": {
"UsageMap": { "ProcessedImageCount": 1 },
"ResultList": [
{ "Language": "en", "FileUrl": "http://dashscope-a717.oss-cn-beijing.aliyuncs.com/.../0c3f295c-translated.jpg" }
],
"GenFiles": [
{
"SrcImage": "https://img.alicdn.com/.../source.jpg",
"EditInfo": {
"ResultImageIds": ["0c39c8ae-5820-11f1-bbb2-8281b7a4eed1"],
"RepairedUrl": "http://dashscope-a717.oss-cn-beijing.aliyuncs.com/.../repaired.png",
"Languages": ["en"],
"TextAreas": [
{
"Fontsize": 32,
"Content": "萌趣造型·清脆响铃",
"Color": "#515151",
"VerticalLayout": "center",
"HorizontalLayout": "left",
"LineCount": 1,
"Texts": [
{
"Fontsize": 29,
"Language": "en",
"Valid": true,
"ImageRect": { "Height": 54, "Left": 43, "Top": 83, "Width": 418, "Degree": 0 },
"TextRect": { "Height": 30, "Left": 8, "Top": 95, "Width": 488, "Degree": 0 },
"Color": "#515151",
"Value": "Adorable Design · Crisp Bell Sound",
"VerticalLayout": "center",
"HorizontalLayout": "center",
"LineCount": 1,
"OvisErrMsg": "| ovis time: 0.748"
}
]
}
],
"GoodsRects": { "Height": 0, "Left": 0, "Top": 0, "Width": 0, "Degree": 0 },
"Font": ["AlibabaSans-Regular"]
},
"ResultList": [
{ "Language": "en", "FileUrl": "http://dashscope-a717.oss-cn-beijing.aliyuncs.com/.../0c3f295c-translated.jpg" }
]
}
]
},
"RequestId": "61785C32-80C2-19A3-9E55-2C3702C84B40",
"Message": "Success",
"Code": "success",
"Success": true
}
异步模式(Async=true)提交响应
Data 仅包含 Data.TaskId(String)与 Data.Status(值为 QUEUED)。请凭 TaskId 调用查询接口获取结果。
{
"Data": {
"TaskId": "T20260612-7f3a9c2e-0001",
"Status": "QUEUED"
},
"RequestId": "61785C32-80C2-19A3-9E55-2C3702C84B40",
"Message": "Success",
"Code": "success",
"Success": true
}
异步查询响应
通过查询接口轮询。Data.Status 取值 QUEUED / IN_PROGRESS / COMPLETED / FAILED,并回传 Data.TaskId。当 COMPLETED 时,Data.UsageMap / Data.ResultList / Data.GenFiles 与同步模式一致;当 FAILED 时返回 Data.FailReason(String)。
{
"Data": {
"TaskId": "T20260612-7f3a9c2e-0001",
"Status": "COMPLETED",
"UsageMap": { "ProcessedImageCount": 1 },
"ResultList": [
{ "Language": "en", "FileUrl": "http://dashscope-a717.oss-cn-beijing.aliyuncs.com/.../0c3f295c-translated.jpg" }
],
"GenFiles": [ ]
},
"RequestId": "61785C32-80C2-19A3-9E55-2C3702C84B40",
"Message": "Success",
"Code": "success",
"Success": true
}
翻译支持的语向
语言代码采用 ISO 639-1 两位字母表示法;区域变体遵循 RFC 5646(如繁体中文 zh-tw)。支持桥接翻译,例如 zh-en、en-ar 可组合出 zh-en-ar。Pro 版额外支持源语言自动识别(auto)。
|
序号 |
源语言 |
源代码 |
目标语言 |
目标代码 |
|
1 |
中文(简体) |
|
英语 |
|
|
2 |
中文(简体) |
|
日语 |
|
|
3 |
中文(简体) |
|
韩语 |
|
|
4 |
阿拉伯语 |
|
英语 |
|
|
5 |
阿塞拜疆语 |
|
英语 |
|
|
6 |
孟加拉语 |
|
英语 |
|
|
7 |
捷克语 |
|
英语 |
|
|
8 |
德语 |
|
英语 |
|
|
9 |
希腊语 |
|
英语 |
|
|
10 |
英语 |
|
阿拉伯语 |
|
|
11 |
英语 |
|
阿塞拜疆语 |
|
|
12 |
英语 |
|
孟加拉语 |
|
|
13 |
英语 |
|
捷克语 |
|
|
14 |
英语 |
|
德语 |
|
|
15 |
英语 |
|
希腊语 |
|
|
16 |
英语 |
|
西班牙语 |
|
|
17 |
英语 |
|
芬兰语 |
|
|
18 |
英语 |
|
法语 |
|
|
19 |
英语 |
|
希伯来语 |
|
|
20 |
英语 |
|
印地语 |
|
|
21 |
英语 |
|
匈牙利语 |
|
|
22 |
英语 |
|
印度尼西亚语 |
|
|
23 |
英语 |
|
意大利语 |
|
|
24 |
英语 |
|
日语 |
|
|
25 |
英语 |
|
韩语 |
|
|
26 |
英语 |
|
马来语 |
|
|
27 |
英语 |
|
缅甸语 |
|
|
28 |
英语 |
|
尼泊尔语 |
|
|
29 |
英语 |
|
荷兰语 |
|
|
30 |
英语 |
|
波兰语 |
|
|
31 |
英语 |
|
葡萄牙语(巴西) |
|
|
32 |
英语 |
|
罗马尼亚语 |
|
|
33 |
英语 |
|
俄语 |
|
|
34 |
英语 |
|
僧伽罗语 |
|
|
35 |
英语 |
|
瑞典语 |
|
|
36 |
英语 |
|
泰语 |
|
|
37 |
英语 |
|
菲律宾语 |
|
|
38 |
英语 |
|
土耳其语 |
|
|
39 |
英语 |
|
乌克兰语 |
|
|
40 |
英语 |
|
乌尔都语 |
|
|
41 |
英语 |
|
越南语 |
|
|
42 |
英语 |
|
中文(简体) |
|
|
43 |
西班牙语 |
|
保加利亚语 |
|
|
44 |
西班牙语 |
|
捷克语 |
|
|
45 |
西班牙语 |
|
丹麦语 |
|
|
46 |
西班牙语 |
|
德语 |
|
|
47 |
西班牙语 |
|
希腊语 |
|
|
48 |
西班牙语 |
|
英语 |
|
|
49 |
西班牙语 |
|
爱沙尼亚语 |
|
|
50 |
西班牙语 |
|
芬兰语 |
|
|
51 |
西班牙语 |
|
法语 |
|
|
52 |
西班牙语 |
|
克罗地亚语 |
|
|
53 |
西班牙语 |
|
匈牙利语 |
|
|
54 |
西班牙语 |
|
意大利语 |
|
|
55 |
西班牙语 |
|
立陶宛语 |
|
|
56 |
西班牙语 |
|
拉脱维亚语 |
|
|
57 |
西班牙语 |
|
荷兰语 |
|
|
58 |
西班牙语 |
|
挪威语 |
|
|
59 |
西班牙语 |
|
波兰语 |
|
|
60 |
西班牙语 |
|
葡萄牙语(巴西) |
|
|
61 |
西班牙语 |
|
罗马尼亚语 |
|
|
62 |
西班牙语 |
|
俄语 |
|
|
63 |
西班牙语 |
|
斯洛伐克语 |
|
|
64 |
西班牙语 |
|
瑞典语 |
|
|
65 |
芬兰语 |
|
英语 |
|
|
66 |
法语 |
|
英语 |
|
|
67 |
希伯来语 |
|
英语 |
|
|
68 |
印地语 |
|
英语 |
|
|
69 |
匈牙利语 |
|
英语 |
|
|
70 |
印度尼西亚语 |
|
英语 |
|
|
71 |
意大利语 |
|
英语 |
|
|
72 |
日语 |
|
英语 |
|
|
73 |
韩语 |
|
英语 |
|
|
74 |
马来语 |
|
英语 |
|
|
75 |
缅甸语 |
|
英语 |
|
|
76 |
尼泊尔语 |
|
英语 |
|
|
77 |
荷兰语 |
|
英语 |
|
|
78 |
波兰语 |
|
英语 |
|
|
79 |
葡萄牙语(巴西) |
|
英语 |
|
|
80 |
罗马尼亚语 |
|
英语 |
|
|
81 |
俄语 |
|
英语 |
|
|
82 |
僧伽罗语 |
|
英语 |
|
|
83 |
瑞典语 |
|
英语 |
|
|
84 |
泰语 |
|
英语 |
|
|
85 |
菲律宾语 |
|
英语 |
|
|
86 |
土耳其语 |
|
阿拉伯语 |
|
|
87 |
土耳其语 |
|
捷克语 |
|
|
88 |
土耳其语 |
|
德语 |
|
|
89 |
土耳其语 |
|
希腊语 |
|
|
90 |
土耳其语 |
|
英语 |
|
|
91 |
土耳其语 |
|
匈牙利语 |
|
|
92 |
土耳其语 |
|
罗马尼亚语 |
|
|
93 |
乌克兰语 |
|
英语 |
|
|
94 |
乌尔都语 |
|
英语 |
|
|
95 |
越南语 |
|
英语 |
|
|
96 |
中文(繁体) |
|
(桥接)经 zh 中转 |
|
错误码
图片翻译共享统一的命名错误码体系。本能力常触发以下错误码:
-
InvalidParameter-- 图片尺寸超过 4000 x 4000 像素、文件大小超过 10 MB、或格式不在支持列表(PNG / JPEG / JPG / BMP / WebP)。 -
DownstreamUnavailable-- 图片 URL 无法访问或图片下载异常。 -
InputContentBlocked-- 图片触发内容安全审核。
完整错误码列表及处理建议,请参见错误码。
使用限制
-
调用模式:支持同步与异步,由
Async字段选择,默认同步。 -
计费:计费单位为每张,¥0.06/张。
-
输入图片:分辨率 ≤ 4000 x 4000 像素;文件 ≤ 10 MB;PNG / JPEG / JPG / BMP / WebP;公网可访问。
-
源语言与目标语言不能相同;支持源语言自动识别(
auto)。 -
QPS 上限详见频率限制。
兼容性与迁移
|
场景 |
行为 |
|
存量用户不传 |
默认 |
|
|
同步调用,等同于不传该字段。 |
|
|
异步提交成功,需主动轮询查询接口获取结果。 |
|
同步调用超时 |
建议客户端设置合理超时(推荐 30s),超时场景建议切换异步。 |