文本纠错

更新时间:
复制 MD 格式

针对搜推场景下的翻译文本做拼写纠错与轻量改写。常用于将买家输入的不规范搜索词归一化、把机翻结果中的明显拼写错误修正后再返回。覆盖 14 个语向。同步调用。

定位与适用场景

本接口是搜索 / 推荐链路里的"前置净化器",不是通用的语法 / 风格改写器。它专注于:

  • 搜索词归一化:把买家输入的 "Hellw World" 纠为 "Hello World",提高召回。

  • 翻译后处理:在文本翻译之后做一道纠错,剔除模型偶发的拼写漂移。

  • UGC 入库前清洗:商品标题 / 评论入库前先纠错,避免脏数据污染索引。

如需识别输入语言,先调语种识别或将 SourceLanguageauto(仅在 14 个支持语向内自动识别)。

接口

POST /ai/text/correction

快速开始

import json

data = json.dumps({
    "SourceText": "Hellw World",
    "SourceLanguage": "en"
})
result = make_signed_request("/ai/text/correction", data)

print(result["Data"]["CorrectedText"])  # "Hello World"

请求参数

参数

类型

必填

说明

SourceText

String

待纠错的原始文本。

SourceLanguage

String

原始语向。在 14 个支持语向内取值(见下方表);也可传 auto 让服务端自动识别(仅在 14 个语向内有效)。

响应字段

字段

类型

说明

Code

String

业务状态码。成功为 Success,其他为命名错误码。

Success

Boolean

本次调用是否成功。

RequestId

String

请求唯一标识。

Message

String

报错信息(仅失败时返回)。

Data.CorrectedText

String

纠错后的文本。如果输入文本本身无明显错误,返回值与输入一致。

Data.UsageMap.InputCharacterCount

Number

本次输入字符数,用于计费核对。

完整示例

请求示例

{
  "SourceText": "Hellw World",
  "SourceLanguage": "en"
}

响应示例

{
  "Code": "success",
  "Message": "Success",
  "Success": true,
  "RequestId": "2157065A-D6C8-1F3E-A4D0-B1234567890",
  "Data": {
    "CorrectedText": "Hello World",
    "UsageMap": { "InputCharacterCount": 11 }
  }
}

支持的语种(14 个)

#

语种名

Language Code

1

阿拉伯语

ar

2

德语

de

3

英语

en

4

西班牙语

es

5

法语

fr

6

希伯来语

he

7

意大利语

it

8

日语

ja

9

韩语

ko

10

荷兰语

nl

11

波兰语

pl

12

葡萄牙语(巴西)

pt

13

俄语

ru

14

乌克兰语

uk

使用建议

  • 仅用于搜推链路:本接口为搜索 / 推荐场景定制,不适合通用文档 / 长文 / 代码片段的拼写纠错。

  • 幂等性判断:如果 CorrectedText == SourceText,说明无需纠错,可在客户端跳过下游处理。

  • 语向外文本:14 个支持语向之外的文本不会被纠错,建议先调语种识别判断后再决定是否走本接口。

  • 与翻译的组合:建议顺序 语种识别 → 文本纠错 → 文本翻译,三步串联可显著提升机翻结果的可读性。

错误码

错误码

触发场景

InvalidParameter

SourceText 为空 / SourceLanguage 不在 14 个支持语向内。

InputContentBlocked

输入文本触发内容安全审核。

FreeQuotaExhausted

试用额度已耗尽。

InternalError

服务端内部错误。请保留 RequestId 联系技术支持。

完整错误码列表参见错误码

使用限制

  • 调用模式:同步。QPS 上限和超时设置详见频率限制

  • 支持语向:14 个,见上表。

  • 计费¥18/百万字符,按 InputCharacterCount 计量。详见翻译类计费。

后续步骤