文本纠错
针对搜推场景下的翻译文本做拼写纠错与轻量改写。常用于将买家输入的不规范搜索词归一化、把机翻结果中的明显拼写错误修正后再返回。覆盖 14 个语向。同步调用。
定位与适用场景
本接口是搜索 / 推荐链路里的"前置净化器",不是通用的语法 / 风格改写器。它专注于:
-
搜索词归一化:把买家输入的
"Hellw World"纠为"Hello World",提高召回。 -
翻译后处理:在文本翻译之后做一道纠错,剔除模型偶发的拼写漂移。
-
UGC 入库前清洗:商品标题 / 评论入库前先纠错,避免脏数据污染索引。
如需识别输入语言,先调语种识别或将 SourceLanguage 传 auto(仅在 14 个支持语向内自动识别)。
接口
POST /ai/text/correction
快速开始
import json
data = json.dumps({
"SourceText": "Hellw World",
"SourceLanguage": "en"
})
result = make_signed_request("/ai/text/correction", data)
print(result["Data"]["CorrectedText"]) # "Hello World"
请求参数
|
参数 |
类型 |
必填 |
说明 |
|
|
String |
是 |
待纠错的原始文本。 |
|
|
String |
是 |
原始语向。在 14 个支持语向内取值(见下方表);也可传 |
响应字段
|
字段 |
类型 |
说明 |
|
|
String |
业务状态码。成功为 |
|
|
Boolean |
本次调用是否成功。 |
|
|
String |
请求唯一标识。 |
|
|
String |
报错信息(仅失败时返回)。 |
|
|
String |
纠错后的文本。如果输入文本本身无明显错误,返回值与输入一致。 |
|
|
Number |
本次输入字符数,用于计费核对。 |
完整示例
请求示例
{
"SourceText": "Hellw World",
"SourceLanguage": "en"
}
响应示例
{
"Code": "success",
"Message": "Success",
"Success": true,
"RequestId": "2157065A-D6C8-1F3E-A4D0-B1234567890",
"Data": {
"CorrectedText": "Hello World",
"UsageMap": { "InputCharacterCount": 11 }
}
}
支持的语种(14 个)
|
# |
语种名 |
Language Code |
|
1 |
阿拉伯语 |
|
|
2 |
德语 |
|
|
3 |
英语 |
|
|
4 |
西班牙语 |
|
|
5 |
法语 |
|
|
6 |
希伯来语 |
|
|
7 |
意大利语 |
|
|
8 |
日语 |
|
|
9 |
韩语 |
|
|
10 |
荷兰语 |
|
|
11 |
波兰语 |
|
|
12 |
葡萄牙语(巴西) |
|
|
13 |
俄语 |
|
|
14 |
乌克兰语 |
|
使用建议
-
仅用于搜推链路:本接口为搜索 / 推荐场景定制,不适合通用文档 / 长文 / 代码片段的拼写纠错。
-
幂等性判断:如果
CorrectedText == SourceText,说明无需纠错,可在客户端跳过下游处理。 -
语向外文本:14 个支持语向之外的文本不会被纠错,建议先调语种识别判断后再决定是否走本接口。
-
与翻译的组合:建议顺序
语种识别 → 文本纠错 → 文本翻译,三步串联可显著提升机翻结果的可读性。
错误码
|
错误码 |
触发场景 |
|
|
|
|
|
输入文本触发内容安全审核。 |
|
|
试用额度已耗尽。 |
|
|
服务端内部错误。请保留 |
完整错误码列表参见错误码。
使用限制
-
调用模式:同步。QPS 上限和超时设置详见频率限制。
-
支持语向:14 个,见上表。
-
计费:¥18/百万字符,按
InputCharacterCount计量。详见翻译类计费。