文本翻译
基于 Marco MT 大语言模型。Marco MT 是 Aidge 的电商场景调优大模型,针对翻译任务做了偏好对齐。详细介绍参见基本概念 › Marco MT。
产品简介
Marco MT 是 10 亿+ 高质量双语句对训练出的电商领域翻译模型,针对电商领域特有的品牌、型号、材质、属性等术语持续优化。支持 100 多种(含桥接)语向间的互译,尤其是中英互译、中文与多语言互译、英文与多语言互译。支持 24 个语向的语种识别,如不设置源语言可实现自动识别。
适用场景
-
商品标题:将标题中的短语、关键词、流行词等准确翻译成目标语言,提升商品在电商平台的曝光率。
-
商品详描:详描整体文本较长、格式多样且复杂,支持长文本翻译和 HTML 格式,翻译效果与格式还原能力表现出色。
-
商品属性:属性词汇较短,且存在电商专有词(如型号、参数)。
-
客服对话:可优化"上下文缺失、打字错误"等问题,并在部分语向上支持礼貌用语。
同时,Marco MT 大模型翻译也可用于通用场景的翻译,如办公、会议、日常对话等。
功能介绍
-
支持的语向清单:支持 100 多种语言之间的互译,支持 24 个语言的语种识别。具体语向见下方支持的语言。
-
超低幻觉率与高速推理:在翻译场景上经过偏好对齐的大语言模型,与通用大语言模型相比,翻译推理速度快、幻觉率极低,尤其适合大规模调用场景。
-
支持的文本格式类型:当前支持
text和html两种文本类型。 -
翻译干预能力:支持自定义翻译结果,包含不被翻译(ABC-ABC)、指定翻译(ABC-DEF)、不翻译(ABC-空值),常用于品牌词保护等场景。调用时传入相应的干预词表 ID 即可生效。一般可上传 10 万条干预词,如需更多可联系平台处理。
翻译效果对比
|
原文 |
Aidge 译后 |
其他翻译产品 1 |
其他翻译产品 2 |
Aidge 翻译优势 |
|
75mm 4Pin 0.38A GA81S2U 12V GTX 960 Cooling Fan for Zotac GTX960 Graphics Card Cooling Fan |
75mm 4Pin 0.38A GA81S2U 12V GTX 960, ventilador de enfriamiento para tarjeta gráfica Zotac GTX960. |
Ventilador de refrigeración de 75mm 4Pin 0.38A GA81S2U 12V para la tarjeta gráfica Zotac GTX960 Ventilador de enfriamiento GTX 960. |
Ventilador de refrigeración para tarjeta gráfica Zotac GTX960, 75mm, 4 pines, 0,38A, GA81S2U, 12V, GTX 960 |
商品主体更清晰 |
|
New Arrival Classic Style Luxury Brand 6 Hands Swiss Automatic Mechanical Men's Business Steel Watch |
Nueva llegada, reloj mecánico automático de lujo con 6 manecillas, estilo clásico, de acero para hombres de negocios |
Nueva Llegada Reloj De Acero de Negocios para Hombre con Mecanismo Automático Suizo y 6 Agujas de Estilo Clásico de Marca de Lujo. |
Reloj de acero de negocios para hombre, mecánico automático suizo, marca de lujo, estilo clásico, 6 manos, nueva llegada |
句式更完整,表述更清晰,断句更合理 |
|
Men Key Bag Genuine Cow Leather Buckets Key Cases Pouch Zipper Keychain Auto Car Key Case Women Home Key Holder Wallet |
Sac à clés pour hommes en cuir de vache véritable, étuis à clés, pochette à fermeture éclair, porte-clés, étui à clé de voiture, porte-clés pour femmes, organisateur de portefeuille |
Porte-clés sac en cuir de vache véritable, étuis à clés en forme de seau, pochette à fermeture éclair, porte-clés auto pour voiture, étui à clés pour femmes, organisateur de clés de maison, portefeuille. |
Hommes porte-clés en cuir de vache véritable sac/pochette fermeture éclair porte-clés Auto voiture porte-clés femmes maison porte-clés organisateur portefeuille |
产品主体表述更清晰明确,是"钥匙包"而非"钥匙扣",其它译文容易对产品主体产生歧义 |
接口
POST /ai/text/marco/translator
快速开始
import os
import json
data = json.dumps({
"SourceTextList": ["Hello, how are you?"],
"TargetLanguage": "zh",
"FormatType": "text"
})
result = make_signed_request("/ai/text/marco/translator", data)
print(result)
预期输出:
{
"Data": {
"Translations": [
{
"TranslatedText": "你好,你好吗?",
"DetectedLanguage": "en",
"Characters": 19
}
],
"UsageMap": { "InputCharacterCount": "19" }
},
"RequestId": "21570000-0000-0000-0000-000000000001",
"Message": "Success",
"Code": "success",
"Success": true
}
请求参数
|
参数 |
类型 |
是否必填 |
说明 |
|
|
List<String> |
是 |
待翻译文本数组。总字符长度不超过 50,000,数组长度不超过 50。 |
|
|
String |
是 |
目标语言代码。详见支持的语言。 |
|
|
String |
否 |
源语言代码。不传入则自动检测语种。 |
|
|
String |
否 |
源文本格式: |
|
|
String |
否 |
干预词表 ID 需要在前台单独创建,并在输入参数中提供其 ID。如果提供的干预词表 ID 为空,则翻译结果将不会被修改。 示例值: |
使用 HTML 格式
将 FormatType 设为 html,翻译时会保留 HTML 标签。使用 <span translate="no">...</span> 包裹不需要翻译的内容(如品牌名、产品型号)。
响应字段
|
字段 |
类型 |
说明 |
|
|
String |
业务状态码。成功为 |
|
|
String |
报错信息。成功时为 |
|
|
Boolean |
是否成功:true 代表成功,false 代表失败。 |
|
|
String |
请求唯一标识。 |
|
|
Array |
翻译结果数组(与请求 |
|
|
String |
对应输入元素的翻译结果文本。 |
|
|
String |
检测到的源语种代码(未传入 |
|
|
Number |
该条文本翻译消耗的字符数。 |
|
|
String |
本次请求输入的总字符数,用于计费核对。 |
支持的语言
翻译支持语向(96)
语言代码采用 ISO 639-1;区域变体用 RFC 5646(如繁体 zh-tw)。支持桥接翻译(如 zh→en + en→ar 可得 zh→ar)。
|
序号 |
源语言 |
源代码 |
目标语言 |
目标代码 |
|
1 |
中文(简体) |
|
英语 |
|
|
2 |
中文(简体) |
|
日语 |
|
|
3 |
中文(简体) |
|
韩语 |
|
|
4 |
阿拉伯语 |
|
英语 |
|
|
5 |
阿塞拜疆语 |
|
英语 |
|
|
6 |
孟加拉语 |
|
英语 |
|
|
7 |
捷克语 |
|
英语 |
|
|
8 |
德语 |
|
英语 |
|
|
9 |
希腊语 |
|
英语 |
|
|
10 |
英语 |
|
阿拉伯语 |
|
|
11 |
英语 |
|
阿塞拜疆语 |
|
|
12 |
英语 |
|
孟加拉语 |
|
|
13 |
英语 |
|
捷克语 |
|
|
14 |
英语 |
|
德语 |
|
|
15 |
英语 |
|
希腊语 |
|
|
16 |
英语 |
|
西班牙语 |
|
|
17 |
英语 |
|
芬兰语 |
|
|
18 |
英语 |
|
法语 |
|
|
19 |
英语 |
|
希伯来语 |
|
|
20 |
英语 |
|
印地语 |
|
|
21 |
英语 |
|
匈牙利语 |
|
|
22 |
英语 |
|
印度尼西亚语 |
|
|
23 |
英语 |
|
意大利语 |
|
|
24 |
英语 |
|
日语 |
|
|
25 |
英语 |
|
韩语 |
|
|
26 |
英语 |
|
马来语 |
|
|
27 |
英语 |
|
缅甸语 |
|
|
28 |
英语 |
|
尼泊尔语 |
|
|
29 |
英语 |
|
荷兰语 |
|
|
30 |
英语 |
|
波兰语 |
|
|
31 |
英语 |
|
葡萄牙语(巴西) |
|
|
32 |
英语 |
|
罗马尼亚语 |
|
|
33 |
英语 |
|
俄语 |
|
|
34 |
英语 |
|
僧伽罗语 |
|
|
35 |
英语 |
|
瑞典语 |
|
|
36 |
英语 |
|
泰语 |
|
|
37 |
英语 |
|
菲律宾语 |
|
|
38 |
英语 |
|
土耳其语 |
|
|
39 |
英语 |
|
乌克兰语 |
|
|
40 |
英语 |
|
乌尔都语 |
|
|
41 |
英语 |
|
越南语 |
|
|
42 |
英语 |
|
中文(简体) |
|
|
43 |
西班牙语 |
|
保加利亚语 |
|
|
44 |
西班牙语 |
|
捷克语 |
|
|
45 |
西班牙语 |
|
丹麦语 |
|
|
46 |
西班牙语 |
|
德语 |
|
|
47 |
西班牙语 |
|
希腊语 |
|
|
48 |
西班牙语 |
|
英语 |
|
|
49 |
西班牙语 |
|
爱沙尼亚语 |
|
|
50 |
西班牙语 |
|
芬兰语 |
|
|
51 |
西班牙语 |
|
法语 |
|
|
52 |
西班牙语 |
|
克罗地亚语 |
|
|
53 |
西班牙语 |
|
匈牙利语 |
|
|
54 |
西班牙语 |
|
意大利语 |
|
|
55 |
西班牙语 |
|
立陶宛语 |
|
|
56 |
西班牙语 |
|
拉脱维亚语 |
|
|
57 |
西班牙语 |
|
荷兰语 |
|
|
58 |
西班牙语 |
|
挪威语 |
|
|
59 |
西班牙语 |
|
波兰语 |
|
|
60 |
西班牙语 |
|
葡萄牙语(巴西) |
|
|
61 |
西班牙语 |
|
罗马尼亚语 |
|
|
62 |
西班牙语 |
|
俄语 |
|
|
63 |
西班牙语 |
|
斯洛伐克语 |
|
|
64 |
西班牙语 |
|
瑞典语 |
|
|
65 |
芬兰语 |
|
英语 |
|
|
66 |
法语 |
|
英语 |
|
|
67 |
希伯来语 |
|
英语 |
|
|
68 |
印地语 |
|
英语 |
|
|
69 |
匈牙利语 |
|
英语 |
|
|
70 |
印度尼西亚语 |
|
英语 |
|
|
71 |
意大利语 |
|
英语 |
|
|
72 |
日语 |
|
英语 |
|
|
73 |
韩语 |
|
英语 |
|
|
74 |
马来语 |
|
英语 |
|
|
75 |
缅甸语 |
|
英语 |
|
|
76 |
尼泊尔语 |
|
英语 |
|
|
77 |
荷兰语 |
|
英语 |
|
|
78 |
波兰语 |
|
英语 |
|
|
79 |
葡萄牙语(巴西) |
|
英语 |
|
|
80 |
罗马尼亚语 |
|
英语 |
|
|
81 |
俄语 |
|
英语 |
|
|
82 |
僧伽罗语 |
|
英语 |
|
|
83 |
瑞典语 |
|
英语 |
|
|
84 |
泰语 |
|
英语 |
|
|
85 |
菲律宾语 |
|
英语 |
|
|
86 |
土耳其语 |
|
阿拉伯语 |
|
|
87 |
土耳其语 |
|
捷克语 |
|
|
88 |
土耳其语 |
|
德语 |
|
|
89 |
土耳其语 |
|
希腊语 |
|
|
90 |
土耳其语 |
|
英语 |
|
|
91 |
土耳其语 |
|
匈牙利语 |
|
|
92 |
土耳其语 |
|
罗马尼亚语 |
|
|
93 |
乌克兰语 |
|
英语 |
|
|
94 |
乌尔都语 |
|
英语 |
|
|
95 |
越南语 |
|
英语 |
|
|
96 |
中文(繁体) |
|
(桥接)经 zh 中转 |
|
语种识别支持语向(24)
|
序号 |
语言名称 |
语言代码 |
|
1 |
阿拉伯语 |
|
|
2 |
孟加拉语 |
|
|
3 |
德语 |
|
|
4 |
英语 |
|
|
5 |
西班牙语 |
|
|
6 |
法语 |
|
|
7 |
希伯来语 |
|
|
8 |
印度尼西亚语 |
|
|
9 |
意大利语 |
|
|
10 |
日语 |
|
|
11 |
韩语 |
|
|
12 |
马来语 |
|
|
13 |
荷兰语 |
|
|
14 |
波兰语 |
|
|
15 |
葡萄牙语(巴西) |
|
|
16 |
俄语 |
|
|
17 |
泰语 |
|
|
18 |
土耳其语 |
|
|
19 |
乌克兰语 |
|
|
20 |
乌尔都语 |
|
|
21 |
越南语 |
|
|
22 |
中文(简体) |
|
|
23 |
中文(繁体) |
|
|
24 |
印地语 |
|
语种识别详见语种识别。
错误码
常见错误码:InvalidParameter(参数不合规,包括语言代码不支持、超长)、InputContentBlocked(输入触发内容安全审核)、FreeQuotaExhausted(试用额度耗尽)、DownstreamUnavailable(下游模型不可用)、Throttling(HTTP 429 限流,需指数退避)、InternalError(系统繁忙)。完整错误码列表详见错误码。QPS 限流详见频率限制。
使用限制
-
调用模式:同步。QPS 上限和超时设置详见频率限制。
-
接口最长响应时间为 30s,调用时建议将请求超时设置为不低于 30s。
-
单次请求最大总字符数:50,000。
-
文本列表最大长度:50 条。
-
计费:¥50/百万字符,按
Translations[].Characters返回的字符数计量。详见翻译类计费。 -
如需提升 QPS 配额,请联系技术支持。