文档翻译
翻译 PDF 或 Word 文档,保留原始排版和图片内文字翻译。支持 100+ 语向(含桥接),单份 PDF / Word 均 100 页以内。本 API 采用异步处理(提交 + 查询)。
产品简介
专为文档翻译研发,支持 100 多种(含桥接)语向之间的互译,满足多场景、多页数、高复杂度文档翻译,暂不支持扫描件。在以下方面表现出色:
-
内容准确性:翻译准确性,参数与单位准确性。
-
结构合理性:整体排版连续性,页面边距与布局还原性。
适用场景
跨境电商商品说明书、合同、协议、商务议案、资质文件、教材课件等多种场景。
功能介绍
-
支持 PDF 及 Word 两种格式,支持源文档中包含多种语言(详细语言清单见下方支持的语向)。
-
支持文档中图片内含文字的翻译,以及图表、特殊符号等复杂翻译场景。
-
支持翻译后排版高度还原。
-
单份 PDF / Word 均支持 100 页以内。
-
支持翻译干预:不被翻译(ABC-ABC)、指定翻译(ABC-DEF)、不翻译(ABC-空值),常用于品牌词保护等场景。调用时传入干预词表 ID 即可生效,一般可上传 10 万条干预词,如需更多可联系平台处理。
接口
提交翻译任务
POST /ai/document/translation
查询翻译结果
POST /ai/document/translation/result
快速开始
import json
import time
data = json.dumps({
"Url": "https://example.com/report.pdf",
"TargetLanguage": "en",
"FileType": "PDF"
})
submit_result = make_signed_request("/ai/document/translation", data)
task_id = submit_result["Data"]["TaskId"]
while True:
query_data = json.dumps({"TaskId": task_id})
result = make_signed_request("/ai/document/translation/result", query_data)
status = result["Data"]["Status"]
if status == "COMPLETED":
# Data.Result 是 JSON 字符串,包含 url 字段
print("下载链接:", json.loads(result["Data"]["Result"])["url"])
break
elif status == "FAILED":
print("任务失败:", result["Data"]["Result"])
break
time.sleep(10)
请求参数(提交)
|
参数 |
类型 |
是否必填 |
说明 |
|
|
String |
是 |
待翻译文档的 OSS URL 路径,需可公网访问。 |
|
|
String |
是 |
目标语言代码。源语言自动检测,无需传入。 |
|
|
String |
是 |
文档类型: |
|
|
String |
否 |
干预词表 ID 需要在前台单独创建,并在输入参数中提供其 ID。如果提供的干预词表 ID 为空,则翻译结果将不会被修改。 示例值: |
请求参数(查询)
|
参数 |
类型 |
是否必填 |
说明 |
|
|
String |
是 |
提交接口返回的任务 ID。 |
响应字段
提交响应
|
字段 |
类型 |
说明 |
|
|
String |
业务状态码。成功为 |
|
|
String |
错误描述。成功时为 |
|
|
String |
请求唯一标识,排查问题时联系技术支持需提供。 |
|
|
String |
唯一任务标识,用于后续查询。 |
查询响应
|
字段 |
类型 |
说明 |
|
|
String |
任务状态: |
|
|
String |
异步任务唯一标识。 |
|
|
String(JSON) |
任务结果(JSON 字符串)。 |
|
|
String |
翻译结果文档的下载 URL( |
|
|
Number |
处理的文档页数,用于计费核对。 |
完整示例
提交响应示例
{
"Data": {
"TaskId": "6071a030-5c92-9df1-96d0-44952343439a"
},
"RequestId": "39E8A74B-F99E-1195-A5FF-3ECC5F94F304",
"Message": "Success",
"Code": "success",
"Success": true
}
查询响应示例
{
"Data": {
"Status": "COMPLETED",
"TaskId": "8b760f7a-56e8-9042-b113-e175797eb2ec",
"Result": "{\"url\": \"https://aib-innovation-oss.oss-accelerate.aliyuncs.com/AI_Business/OdIpM/translated_ar.pdf?Expires=...\", \"usageMap\": \"{\\\"ProcessedDocumentPageCount\\\":2}\"}",
"UsageMap": { "ProcessedDocumentPageCount": "2" }
},
"RequestId": "F260E502-3FA9-1F79-99A6-F751CE8559C7",
"Message": "Success",
"Code": "success",
"Success": true
}
计费方式
所有文档类型(PDF、Word)均按页计费。
翻译支持语向(96)
语言代码采用 ISO 639-1;区域变体用 RFC 5646(如繁体 zh-tw)。支持桥接翻译(如 zh→en + en→ar 可得 zh→ar)。
|
序号 |
源语言 |
源代码 |
目标语言 |
目标代码 |
|
1 |
中文(简体) |
|
英语 |
|
|
2 |
中文(简体) |
|
日语 |
|
|
3 |
中文(简体) |
|
韩语 |
|
|
4 |
阿拉伯语 |
|
英语 |
|
|
5 |
阿塞拜疆语 |
|
英语 |
|
|
6 |
孟加拉语 |
|
英语 |
|
|
7 |
捷克语 |
|
英语 |
|
|
8 |
德语 |
|
英语 |
|
|
9 |
希腊语 |
|
英语 |
|
|
10 |
英语 |
|
阿拉伯语 |
|
|
11 |
英语 |
|
阿塞拜疆语 |
|
|
12 |
英语 |
|
孟加拉语 |
|
|
13 |
英语 |
|
捷克语 |
|
|
14 |
英语 |
|
德语 |
|
|
15 |
英语 |
|
希腊语 |
|
|
16 |
英语 |
|
西班牙语 |
|
|
17 |
英语 |
|
芬兰语 |
|
|
18 |
英语 |
|
法语 |
|
|
19 |
英语 |
|
希伯来语 |
|
|
20 |
英语 |
|
印地语 |
|
|
21 |
英语 |
|
匈牙利语 |
|
|
22 |
英语 |
|
印度尼西亚语 |
|
|
23 |
英语 |
|
意大利语 |
|
|
24 |
英语 |
|
日语 |
|
|
25 |
英语 |
|
韩语 |
|
|
26 |
英语 |
|
马来语 |
|
|
27 |
英语 |
|
缅甸语 |
|
|
28 |
英语 |
|
尼泊尔语 |
|
|
29 |
英语 |
|
荷兰语 |
|
|
30 |
英语 |
|
波兰语 |
|
|
31 |
英语 |
|
葡萄牙语(巴西) |
|
|
32 |
英语 |
|
罗马尼亚语 |
|
|
33 |
英语 |
|
俄语 |
|
|
34 |
英语 |
|
僧伽罗语 |
|
|
35 |
英语 |
|
瑞典语 |
|
|
36 |
英语 |
|
泰语 |
|
|
37 |
英语 |
|
菲律宾语 |
|
|
38 |
英语 |
|
土耳其语 |
|
|
39 |
英语 |
|
乌克兰语 |
|
|
40 |
英语 |
|
乌尔都语 |
|
|
41 |
英语 |
|
越南语 |
|
|
42 |
英语 |
|
中文(简体) |
|
|
43 |
西班牙语 |
|
保加利亚语 |
|
|
44 |
西班牙语 |
|
捷克语 |
|
|
45 |
西班牙语 |
|
丹麦语 |
|
|
46 |
西班牙语 |
|
德语 |
|
|
47 |
西班牙语 |
|
希腊语 |
|
|
48 |
西班牙语 |
|
英语 |
|
|
49 |
西班牙语 |
|
爱沙尼亚语 |
|
|
50 |
西班牙语 |
|
芬兰语 |
|
|
51 |
西班牙语 |
|
法语 |
|
|
52 |
西班牙语 |
|
克罗地亚语 |
|
|
53 |
西班牙语 |
|
匈牙利语 |
|
|
54 |
西班牙语 |
|
意大利语 |
|
|
55 |
西班牙语 |
|
立陶宛语 |
|
|
56 |
西班牙语 |
|
拉脱维亚语 |
|
|
57 |
西班牙语 |
|
荷兰语 |
|
|
58 |
西班牙语 |
|
挪威语 |
|
|
59 |
西班牙语 |
|
波兰语 |
|
|
60 |
西班牙语 |
|
葡萄牙语(巴西) |
|
|
61 |
西班牙语 |
|
罗马尼亚语 |
|
|
62 |
西班牙语 |
|
俄语 |
|
|
63 |
西班牙语 |
|
斯洛伐克语 |
|
|
64 |
西班牙语 |
|
瑞典语 |
|
|
65 |
芬兰语 |
|
英语 |
|
|
66 |
法语 |
|
英语 |
|
|
67 |
希伯来语 |
|
英语 |
|
|
68 |
印地语 |
|
英语 |
|
|
69 |
匈牙利语 |
|
英语 |
|
|
70 |
印度尼西亚语 |
|
英语 |
|
|
71 |
意大利语 |
|
英语 |
|
|
72 |
日语 |
|
英语 |
|
|
73 |
韩语 |
|
英语 |
|
|
74 |
马来语 |
|
英语 |
|
|
75 |
缅甸语 |
|
英语 |
|
|
76 |
尼泊尔语 |
|
英语 |
|
|
77 |
荷兰语 |
|
英语 |
|
|
78 |
波兰语 |
|
英语 |
|
|
79 |
葡萄牙语(巴西) |
|
英语 |
|
|
80 |
罗马尼亚语 |
|
英语 |
|
|
81 |
俄语 |
|
英语 |
|
|
82 |
僧伽罗语 |
|
英语 |
|
|
83 |
瑞典语 |
|
英语 |
|
|
84 |
泰语 |
|
英语 |
|
|
85 |
菲律宾语 |
|
英语 |
|
|
86 |
土耳其语 |
|
阿拉伯语 |
|
|
87 |
土耳其语 |
|
捷克语 |
|
|
88 |
土耳其语 |
|
德语 |
|
|
89 |
土耳其语 |
|
希腊语 |
|
|
90 |
土耳其语 |
|
英语 |
|
|
91 |
土耳其语 |
|
匈牙利语 |
|
|
92 |
土耳其语 |
|
罗马尼亚语 |
|
|
93 |
乌克兰语 |
|
英语 |
|
|
94 |
乌尔都语 |
|
英语 |
|
|
95 |
越南语 |
|
英语 |
|
|
96 |
中文(繁体) |
|
(桥接)经 zh 中转 |
|
语种识别支持语向(24)
|
序号 |
语言名称 |
语言代码 |
|
1 |
阿拉伯语 |
|
|
2 |
孟加拉语 |
|
|
3 |
德语 |
|
|
4 |
英语 |
|
|
5 |
西班牙语 |
|
|
6 |
法语 |
|
|
7 |
希伯来语 |
|
|
8 |
印度尼西亚语 |
|
|
9 |
意大利语 |
|
|
10 |
日语 |
|
|
11 |
韩语 |
|
|
12 |
马来语 |
|
|
13 |
荷兰语 |
|
|
14 |
波兰语 |
|
|
15 |
葡萄牙语(巴西) |
|
|
16 |
俄语 |
|
|
17 |
泰语 |
|
|
18 |
土耳其语 |
|
|
19 |
乌克兰语 |
|
|
20 |
乌尔都语 |
|
|
21 |
越南语 |
|
|
22 |
中文(简体) |
|
|
23 |
中文(繁体) |
|
|
24 |
印地语 |
|
使用限制
错误码
常见错误码:InvalidParameter(参数缺失或不合规,如 URL 不可访问、FileType 不支持)、InputContentBlocked(文档内容违规)、DownstreamUnavailable(文档下载失败或下游服务暂不可用)、InternalError(系统繁忙)。完整列表参见错误码。