质检工具目前支持25个检查项。
检查项 | 严重级别 | 描述 |
---|---|---|
Numeric Mismatch | Minor | 原文和译文内的数字一致性检查,原文有的数字译文内没有,或者原文没有的数字而出现在译文内。即原文和译文双向都检查,包括数字的内容、个数是否一致。 |
All UPPERCASE Mismatch | Major | 原文和译文内的“全大写”单词一致性检查。若原文的全大写单词未出现在译文内,或原文没有的全大写单词而出现在译文内。即原文和译文双向都检查,包括全大写单词的个数和内容是否一致。 |
CamelCase Mismatch | Major | 原文和译文内的驼峰字(单词内含有两个及以上的大写字母,同时含有小写字母)是否一致。若原文的驼峰字单词未出现在译文内,或原文没有的驼峰字单词而出现在译文内。原文和译文双向都检查,包括驼峰字个数和内容是否一致。 |
Alphanumeric Mismatch | Major | 原文和译文内的字母+数字组合的单词是否一致,即原文和译文双向都检查,包括组合单词的个数和内容是否一致。 |
Inconsistency in Source | Minor | 译文相同而原文不同的多个句子。 |
Inconsistency in Target | Minor | 原文相同而译文不同的多个句子。 |
Target Same as Source | Minor | 原文和译文一样。 |
Punctuation | Minor | 存在连续两个及以上重复的标点符号(忽略省略号)。 |
Repeated Words | Major | 译文内存在连续重复两次或以上的单词。 |
Multiple Whitespaces | Minor | 译文内存在连续两个或以上空格(包括Tab健) 。 |
Spelling | Minor | 译文内存在拼写错误。 |
Tag Mismatch | Major | 原文和译文内的tag数量、名称不一致。Tag标记对目前仅包括<x attr="value">这样的XML格式标记对。 |
Tag Error | Critical | 译文中的标记对不成对的情况。 |
Untranslated | Major | 漏译,即译文为空。 |
Term Consistency | Minor | 术语一致性检查,若原文某个单词出现在术语表,而译文不存在对应语种的术语,则报错。 |
MT Compare | Minor | 提高BLEU测试集结果的客观性,将机器翻译结果与人工翻译结果比对,越相似,分数越高。 |
Length Ratio | Minor | 原文和译文的单词长度的比例,返回一个浮点数。可以设置上下阈值来确定是否有问题。 |
Source Target Similarity | Minor | 原文和译文的相似性。使用编辑距离来计算相似度。 |
Html Tags Check | Minor | 检查原文或译文中是否有html标签,比如<div>。 |
Html Escape Token Check | Minor | 检查原文或译文中是否有html转义字符,比如 |
Large Token Check | Minor | 超长单词检查,比如超过20个字符的单词。 |
URL/Email/Order Number consistency check | Major | 原文和译文之间的URL、Email的一致性。 |
FULL WIDTH CHARACTER | Minor | 检查句子中的全角字符(译文语言为中/日/韩/泰时检查)。 |
STYLE | Minor | 检查译文中的特定样式。 |
GRAMMAR | Minor | 检查句子中的预发错误。 |