文本翻译

更新时间:
复制为 MD 格式

基于 Marco MT 大语言模型。Marco MT 是 Aidge 的电商场景调优大模型,针对翻译任务做了偏好对齐。详细介绍参见基本概念 › Marco MT。

产品简介

Marco MT 是 10 亿+ 高质量双语句对训练出的电商领域翻译模型,针对电商领域特有的品牌、型号、材质、属性等术语持续优化。支持 100 多种(含桥接)语向间的互译,尤其是中英互译、中文与多语言互译、英文与多语言互译。支持 24 个语向的语种识别,如不设置源语言可实现自动识别。

适用场景

  • 商品标题:将标题中的短语、关键词、流行词等准确翻译成目标语言,提升商品在电商平台的曝光率。

  • 商品详描:详描整体文本较长、格式多样且复杂,支持长文本翻译和 HTML 格式,翻译效果与格式还原能力表现出色。

  • 商品属性:属性词汇较短,且存在电商专有词(如型号、参数)。

  • 客服对话:可优化"上下文缺失、打字错误"等问题,并在部分语向上支持礼貌用语。

同时,Marco MT 大模型翻译也可用于通用场景的翻译,如办公、会议、日常对话等。

功能介绍

  • 支持的语向清单:支持 100 多种语言之间的互译,支持 24 个语言的语种识别。具体语向见下方支持的语言

  • 超低幻觉率与高速推理:在翻译场景上经过偏好对齐的大语言模型,与通用大语言模型相比,翻译推理速度快、幻觉率极低,尤其适合大规模调用场景。

  • 支持的文本格式类型:当前支持 texthtml 两种文本类型。

  • 翻译干预能力:支持自定义翻译结果,包含不被翻译(ABC-ABC)、指定翻译(ABC-DEF)、不翻译(ABC-空值),常用于品牌词保护等场景。调用时传入相应的干预词表 ID 即可生效。一般可上传 10 万条干预词,如需更多可联系平台处理。

翻译效果对比

原文

Aidge 译后

其他翻译产品 1

其他翻译产品 2

Aidge 翻译优势

75mm 4Pin 0.38A GA81S2U 12V GTX 960 Cooling Fan for Zotac GTX960 Graphics Card Cooling Fan

75mm 4Pin 0.38A GA81S2U 12V GTX 960, ventilador de enfriamiento para tarjeta gráfica Zotac GTX960.

Ventilador de refrigeración de 75mm 4Pin 0.38A GA81S2U 12V para la tarjeta gráfica Zotac GTX960 Ventilador de enfriamiento GTX 960.

Ventilador de refrigeración para tarjeta gráfica Zotac GTX960, 75mm, 4 pines, 0,38A, GA81S2U, 12V, GTX 960

商品主体更清晰

New Arrival Classic Style Luxury Brand 6 Hands Swiss Automatic Mechanical Men's Business Steel Watch

Nueva llegada, reloj mecánico automático de lujo con 6 manecillas, estilo clásico, de acero para hombres de negocios

Nueva Llegada Reloj De Acero de Negocios para Hombre con Mecanismo Automático Suizo y 6 Agujas de Estilo Clásico de Marca de Lujo.

Reloj de acero de negocios para hombre, mecánico automático suizo, marca de lujo, estilo clásico, 6 manos, nueva llegada

句式更完整,表述更清晰,断句更合理

Men Key Bag Genuine Cow Leather Buckets Key Cases Pouch Zipper Keychain Auto Car Key Case Women Home Key Holder Wallet

Sac à clés pour hommes en cuir de vache véritable, étuis à clés, pochette à fermeture éclair, porte-clés, étui à clé de voiture, porte-clés pour femmes, organisateur de portefeuille

Porte-clés sac en cuir de vache véritable, étuis à clés en forme de seau, pochette à fermeture éclair, porte-clés auto pour voiture, étui à clés pour femmes, organisateur de clés de maison, portefeuille.

Hommes porte-clés en cuir de vache véritable sac/pochette fermeture éclair porte-clés Auto voiture porte-clés femmes maison porte-clés organisateur portefeuille

产品主体表述更清晰明确,是"钥匙包"而非"钥匙扣",其它译文容易对产品主体产生歧义

接口

POST /ai/text/marco/translator

快速开始

import os
import json

data = json.dumps({
    "SourceTextList": ["Hello, how are you?"],
    "TargetLanguage": "zh",
    "FormatType": "text"
})

result = make_signed_request("/ai/text/marco/translator", data)
print(result)

预期输出:

{
  "Data": {
    "Translations": [
      {
        "TranslatedText": "你好,你好吗?",
        "DetectedLanguage": "en",
        "Characters": 19
      }
    ],
    "UsageMap": { "InputCharacterCount": "19" }
  },
  "RequestId": "21570000-0000-0000-0000-000000000001",
  "Message": "Success",
  "Code": "success",
  "Success": true
}

请求参数

参数

类型

是否必填

说明

SourceTextList

List<String>

待翻译文本数组。总字符长度不超过 50,000,数组长度不超过 50。

TargetLanguage

String

目标语言代码。详见支持的语言

SourceLanguage

String

源语言代码。不传入则自动检测语种。

FormatType

String

源文本格式:text(默认)或 html

Glossary

String

干预词表 ID 需要在前台单独创建,并在输入参数中提供其 ID。如果提供的干预词表 ID 为空,则翻译结果将不会被修改。

示例值:"glossary_1"

使用 HTML 格式

FormatType 设为 html,翻译时会保留 HTML 标签。使用 <span translate="no">...</span> 包裹不需要翻译的内容(如品牌名、产品型号)。

响应字段

字段

类型

说明

Code

String

业务状态码。成功为 success

Message

String

报错信息。成功时为 Success

Success

Boolean

是否成功:true 代表成功,false 代表失败。

RequestId

String

请求唯一标识。

Data.Translations

Array

翻译结果数组(与请求 SourceTextList 数组中的输入元素一一对应)。

Data.Translations[].TranslatedText

String

对应输入元素的翻译结果文本。

Data.Translations[].DetectedLanguage

String

检测到的源语种代码(未传入 SourceLanguage 时返回)。

Data.Translations[].Characters

Number

该条文本翻译消耗的字符数。

Data.UsageMap.InputCharacterCount

String

本次请求输入的总字符数,用于计费核对。

支持的语言

翻译支持语向(96)

语言代码采用 ISO 639-1;区域变体用 RFC 5646(如繁体 zh-tw)。支持桥接翻译(如 zh→en + en→ar 可得 zh→ar)。

序号

源语言

源代码

目标语言

目标代码

1

中文(简体)

zh

英语

en

2

中文(简体)

zh

日语

ja

3

中文(简体)

zh

韩语

ko

4

阿拉伯语

ar

英语

en

5

阿塞拜疆语

az

英语

en

6

孟加拉语

bn

英语

en

7

捷克语

cs

英语

en

8

德语

de

英语

en

9

希腊语

el

英语

en

10

英语

en

阿拉伯语

ar

11

英语

en

阿塞拜疆语

az

12

英语

en

孟加拉语

bn

13

英语

en

捷克语

cs

14

英语

en

德语

de

15

英语

en

希腊语

el

16

英语

en

西班牙语

es

17

英语

en

芬兰语

fi

18

英语

en

法语

fr

19

英语

en

希伯来语

he

20

英语

en

印地语

hi

21

英语

en

匈牙利语

hu

22

英语

en

印度尼西亚语

id

23

英语

en

意大利语

it

24

英语

en

日语

ja

25

英语

en

韩语

ko

26

英语

en

马来语

ms

27

英语

en

缅甸语

my

28

英语

en

尼泊尔语

ne

29

英语

en

荷兰语

nl

30

英语

en

波兰语

pl

31

英语

en

葡萄牙语(巴西)

pt

32

英语

en

罗马尼亚语

ro

33

英语

en

俄语

ru

34

英语

en

僧伽罗语

si

35

英语

en

瑞典语

sv

36

英语

en

泰语

th

37

英语

en

菲律宾语

tl

38

英语

en

土耳其语

tr

39

英语

en

乌克兰语

uk

40

英语

en

乌尔都语

ur

41

英语

en

越南语

vi

42

英语

en

中文(简体)

zh

43

西班牙语

es

保加利亚语

bg

44

西班牙语

es

捷克语

cs

45

西班牙语

es

丹麦语

da

46

西班牙语

es

德语

de

47

西班牙语

es

希腊语

el

48

西班牙语

es

英语

en

49

西班牙语

es

爱沙尼亚语

et

50

西班牙语

es

芬兰语

fi

51

西班牙语

es

法语

fr

52

西班牙语

es

克罗地亚语

hr

53

西班牙语

es

匈牙利语

hu

54

西班牙语

es

意大利语

it

55

西班牙语

es

立陶宛语

lt

56

西班牙语

es

拉脱维亚语

lv

57

西班牙语

es

荷兰语

nl

58

西班牙语

es

挪威语

no

59

西班牙语

es

波兰语

pl

60

西班牙语

es

葡萄牙语(巴西)

pt

61

西班牙语

es

罗马尼亚语

ro

62

西班牙语

es

俄语

ru

63

西班牙语

es

斯洛伐克语

sk

64

西班牙语

es

瑞典语

sv

65

芬兰语

fi

英语

en

66

法语

fr

英语

en

67

希伯来语

he

英语

en

68

印地语

hi

英语

en

69

匈牙利语

hu

英语

en

70

印度尼西亚语

id

英语

en

71

意大利语

it

英语

en

72

日语

ja

英语

en

73

韩语

ko

英语

en

74

马来语

ms

英语

en

75

缅甸语

my

英语

en

76

尼泊尔语

ne

英语

en

77

荷兰语

nl

英语

en

78

波兰语

pl

英语

en

79

葡萄牙语(巴西)

pt

英语

en

80

罗马尼亚语

ro

英语

en

81

俄语

ru

英语

en

82

僧伽罗语

si

英语

en

83

瑞典语

sv

英语

en

84

泰语

th

英语

en

85

菲律宾语

tl

英语

en

86

土耳其语

tr

阿拉伯语

ar

87

土耳其语

tr

捷克语

cs

88

土耳其语

tr

德语

de

89

土耳其语

tr

希腊语

el

90

土耳其语

tr

英语

en

91

土耳其语

tr

匈牙利语

hu

92

土耳其语

tr

罗马尼亚语

ro

93

乌克兰语

uk

英语

en

94

乌尔都语

ur

英语

en

95

越南语

vi

英语

en

96

中文(繁体)

zh-tw

(桥接)经 zh 中转

zh-tw→zh→…

语种识别支持语向(24)

序号

语言名称

语言代码

1

阿拉伯语

ar

2

孟加拉语

bn

3

德语

de

4

英语

en

5

西班牙语

es

6

法语

fr

7

希伯来语

he

8

印度尼西亚语

id

9

意大利语

it

10

日语

ja

11

韩语

ko

12

马来语

ms

13

荷兰语

nl

14

波兰语

pl

15

葡萄牙语(巴西)

pt

16

俄语

ru

17

泰语

th

18

土耳其语

tr

19

乌克兰语

uk

20

乌尔都语

ur

21

越南语

vi

22

中文(简体)

zh

23

中文(繁体)

zh-tw

24

印地语

hi

语种识别详见语种识别

错误码

常见错误码:InvalidParameter(参数不合规,包括语言代码不支持、超长)、InputContentBlocked(输入触发内容安全审核)、FreeQuotaExhausted(试用额度耗尽)、DownstreamUnavailable(下游模型不可用)、Throttling(HTTP 429 限流,需指数退避)、InternalError(系统繁忙)。完整错误码列表详见错误码。QPS 限流详见频率限制

使用限制

  • 调用模式:同步。QPS 上限和超时设置详见频率限制

  • 接口最长响应时间为 30s,调用时建议将请求超时设置为不低于 30s。

  • 单次请求最大总字符数:50,000。

  • 文本列表最大长度:50 条。

  • 计费¥50/百万字符,按 Translations[].Characters 返回的字符数计量。详见翻译类计费。

  • 如需提升 QPS 配额,请联系技术支持。

后续步骤