文档翻译

更新时间:
复制 MD 格式

翻译 PDF 或 Word 文档,保留原始排版和图片内文字翻译。支持 100+ 语向(含桥接),单份 PDF / Word 均 100 页以内。本 API 采用异步处理(提交 + 查询)。

产品简介

专为文档翻译研发,支持 100 多种(含桥接)语向之间的互译,满足多场景、多页数、高复杂度文档翻译,暂不支持扫描件。在以下方面表现出色:

  • 内容准确性:翻译准确性,参数与单位准确性。

  • 结构合理性:整体排版连续性,页面边距与布局还原性。

适用场景

跨境电商商品说明书、合同、协议、商务议案、资质文件、教材课件等多种场景。

功能介绍

  • 支持 PDF 及 Word 两种格式,支持源文档中包含多种语言(详细语言清单见下方支持的语向)。

  • 支持文档中图片内含文字的翻译,以及图表、特殊符号等复杂翻译场景。

  • 支持翻译后排版高度还原。

  • 单份 PDF / Word 均支持 100 页以内。

  • 支持翻译干预:不被翻译(ABC-ABC)、指定翻译(ABC-DEF)、不翻译(ABC-空值),常用于品牌词保护等场景。调用时传入干预词表 ID 即可生效,一般可上传 10 万条干预词,如需更多可联系平台处理。

接口

提交翻译任务

POST /ai/document/translation

查询翻译结果

POST /ai/document/translation/result

快速开始

import json
import time

data = json.dumps({
    "Url": "https://example.com/report.pdf",
    "TargetLanguage": "en",
    "FileType": "PDF"
})
submit_result = make_signed_request("/ai/document/translation", data)
task_id = submit_result["Data"]["TaskId"]

while True:
    query_data = json.dumps({"TaskId": task_id})
    result = make_signed_request("/ai/document/translation/result", query_data)
    status = result["Data"]["Status"]
    if status == "COMPLETED":
        # Data.Result 是 JSON 字符串,包含 url 字段
        print("下载链接:", json.loads(result["Data"]["Result"])["url"])
        break
    elif status == "FAILED":
        print("任务失败:", result["Data"]["Result"])
        break
    time.sleep(10)

请求参数(提交)

参数

类型

是否必填

说明

Url

String

待翻译文档的 OSS URL 路径,需可公网访问。

TargetLanguage

String

目标语言代码。源语言自动检测,无需传入。

FileType

String

文档类型:PDFword。容量限制:Word ≤ 200 MB / 100 页;PDF ≤ 200 MB / 100 页。

Glossary

String

干预词表 ID 需要在前台单独创建,并在输入参数中提供其 ID。如果提供的干预词表 ID 为空,则翻译结果将不会被修改。

示例值:"glossary_1"

请求参数(查询)

参数

类型

是否必填

说明

TaskId

String

提交接口返回的任务 ID。

响应字段

提交响应

字段

类型

说明

Code

String

业务状态码。成功为 Success

Message

String

错误描述。成功时为 "ok"

RequestId

String

请求唯一标识,排查问题时联系技术支持需提供。

Data.TaskId

String

唯一任务标识,用于后续查询。

查询响应

字段

类型

说明

Data.Status

String

任务状态:QUEUED(排队中)、IN_PROGRESS(执行中)、COMPLETED(完成)、FAILED(失败)。

Data.TaskId

String

异步任务唯一标识。

Data.Result

String(JSON)

任务结果(JSON 字符串)。COMPLETED 时含 url(翻译结果下载 URL);FAILED 时返回失败原因。

Data.Result.url

String

翻译结果文档的下载 URL(Data.Result JSON 解析后的 url 字段)。

Data.UsageMap.ProcessedDocumentPageCount

Number

处理的文档页数,用于计费核对。

完整示例

提交响应示例

{
  "Data": {
    "TaskId": "6071a030-5c92-9df1-96d0-44952343439a"
  },
  "RequestId": "39E8A74B-F99E-1195-A5FF-3ECC5F94F304",
  "Message": "Success",
  "Code": "success",
  "Success": true
}

查询响应示例

{
  "Data": {
    "Status": "COMPLETED",
    "TaskId": "8b760f7a-56e8-9042-b113-e175797eb2ec",
    "Result": "{\"url\": \"https://aib-innovation-oss.oss-accelerate.aliyuncs.com/AI_Business/OdIpM/translated_ar.pdf?Expires=...\", \"usageMap\": \"{\\\"ProcessedDocumentPageCount\\\":2}\"}",
    "UsageMap": { "ProcessedDocumentPageCount": "2" }
  },
  "RequestId": "F260E502-3FA9-1F79-99A6-F751CE8559C7",
  "Message": "Success",
  "Code": "success",
  "Success": true
}

计费方式

所有文档类型(PDF、Word)均按页计费。

翻译支持语向(96)

语言代码采用 ISO 639-1;区域变体用 RFC 5646(如繁体 zh-tw)。支持桥接翻译(如 zh→en + en→ar 可得 zh→ar)。

序号

源语言

源代码

目标语言

目标代码

1

中文(简体)

zh

英语

en

2

中文(简体)

zh

日语

ja

3

中文(简体)

zh

韩语

ko

4

阿拉伯语

ar

英语

en

5

阿塞拜疆语

az

英语

en

6

孟加拉语

bn

英语

en

7

捷克语

cs

英语

en

8

德语

de

英语

en

9

希腊语

el

英语

en

10

英语

en

阿拉伯语

ar

11

英语

en

阿塞拜疆语

az

12

英语

en

孟加拉语

bn

13

英语

en

捷克语

cs

14

英语

en

德语

de

15

英语

en

希腊语

el

16

英语

en

西班牙语

es

17

英语

en

芬兰语

fi

18

英语

en

法语

fr

19

英语

en

希伯来语

he

20

英语

en

印地语

hi

21

英语

en

匈牙利语

hu

22

英语

en

印度尼西亚语

id

23

英语

en

意大利语

it

24

英语

en

日语

ja

25

英语

en

韩语

ko

26

英语

en

马来语

ms

27

英语

en

缅甸语

my

28

英语

en

尼泊尔语

ne

29

英语

en

荷兰语

nl

30

英语

en

波兰语

pl

31

英语

en

葡萄牙语(巴西)

pt

32

英语

en

罗马尼亚语

ro

33

英语

en

俄语

ru

34

英语

en

僧伽罗语

si

35

英语

en

瑞典语

sv

36

英语

en

泰语

th

37

英语

en

菲律宾语

tl

38

英语

en

土耳其语

tr

39

英语

en

乌克兰语

uk

40

英语

en

乌尔都语

ur

41

英语

en

越南语

vi

42

英语

en

中文(简体)

zh

43

西班牙语

es

保加利亚语

bg

44

西班牙语

es

捷克语

cs

45

西班牙语

es

丹麦语

da

46

西班牙语

es

德语

de

47

西班牙语

es

希腊语

el

48

西班牙语

es

英语

en

49

西班牙语

es

爱沙尼亚语

et

50

西班牙语

es

芬兰语

fi

51

西班牙语

es

法语

fr

52

西班牙语

es

克罗地亚语

hr

53

西班牙语

es

匈牙利语

hu

54

西班牙语

es

意大利语

it

55

西班牙语

es

立陶宛语

lt

56

西班牙语

es

拉脱维亚语

lv

57

西班牙语

es

荷兰语

nl

58

西班牙语

es

挪威语

no

59

西班牙语

es

波兰语

pl

60

西班牙语

es

葡萄牙语(巴西)

pt

61

西班牙语

es

罗马尼亚语

ro

62

西班牙语

es

俄语

ru

63

西班牙语

es

斯洛伐克语

sk

64

西班牙语

es

瑞典语

sv

65

芬兰语

fi

英语

en

66

法语

fr

英语

en

67

希伯来语

he

英语

en

68

印地语

hi

英语

en

69

匈牙利语

hu

英语

en

70

印度尼西亚语

id

英语

en

71

意大利语

it

英语

en

72

日语

ja

英语

en

73

韩语

ko

英语

en

74

马来语

ms

英语

en

75

缅甸语

my

英语

en

76

尼泊尔语

ne

英语

en

77

荷兰语

nl

英语

en

78

波兰语

pl

英语

en

79

葡萄牙语(巴西)

pt

英语

en

80

罗马尼亚语

ro

英语

en

81

俄语

ru

英语

en

82

僧伽罗语

si

英语

en

83

瑞典语

sv

英语

en

84

泰语

th

英语

en

85

菲律宾语

tl

英语

en

86

土耳其语

tr

阿拉伯语

ar

87

土耳其语

tr

捷克语

cs

88

土耳其语

tr

德语

de

89

土耳其语

tr

希腊语

el

90

土耳其语

tr

英语

en

91

土耳其语

tr

匈牙利语

hu

92

土耳其语

tr

罗马尼亚语

ro

93

乌克兰语

uk

英语

en

94

乌尔都语

ur

英语

en

95

越南语

vi

英语

en

96

中文(繁体)

zh-tw

(桥接)经 zh 中转

zh-tw→zh→…

语种识别支持语向(24)

序号

语言名称

语言代码

1

阿拉伯语

ar

2

孟加拉语

bn

3

德语

de

4

英语

en

5

西班牙语

es

6

法语

fr

7

希伯来语

he

8

印度尼西亚语

id

9

意大利语

it

10

日语

ja

11

韩语

ko

12

马来语

ms

13

荷兰语

nl

14

波兰语

pl

15

葡萄牙语(巴西)

pt

16

俄语

ru

17

泰语

th

18

土耳其语

tr

19

乌克兰语

uk

20

乌尔都语

ur

21

越南语

vi

22

中文(简体)

zh

23

中文(繁体)

zh-tw

24

印地语

hi

使用限制

  • 调用模式:异步。查询接口无 QPS 限制,建议轮询间隔 ≥ 5 秒。提交接口的 QPS 上限详见频率限制

  • 支持的文件类型:PDF(≤ 200 MB / 100 页)、Word docx(≤ 200 MB / 100 页)。

  • 支持的语言:100+ 种(含桥接),与文本翻译一致。完整语向清单见支持的语言

  • 计费:计费单位为每页(PDF / Word),¥0.08/页。详见翻译类计费。

错误码

常见错误码:InvalidParameter(参数缺失或不合规,如 URL 不可访问、FileType 不支持)、InputContentBlocked(文档内容违规)、DownstreamUnavailable(文档下载失败或下游服务暂不可用)、InternalError(系统繁忙)。完整列表参见错误码

后续步骤