机器翻译自学习平台使用指南

机器翻译自学习平台适用于无算法背景,但对非通用领域翻译质量要求较高,且至少有上万条高质量双语语料的用户。适用场景包括,医学专业术语以及专业的表达句式翻译难度较大的医疗领域、对翻译时效性和准确性要求较高,单单依靠人工翻译不能做到时效性和准确性兼顾的金融领域等。

说明

定制模型若想取得明显的效果提升,至少需要1万条高质量双语语料。训练语料越优质、数量级越大,定制模型的效果会越好。

使用流程概述

image

平台使用指南

1.新建项目

进入机器翻译控制台,选择我的项目栏,点击创建项目按钮新建项目,注意,一个项目可添加多个项目管理员,管理员拥有这个项目下所有权限,可以通过输入阿里云账号添加。

自学习--创建项目按钮.jpg

image

2.新建定制模型

项目创建完成后,点击新建定制模型按钮新建定制模型。

自学习--创建模型按钮.jpg

image

3.数据上传

上传用于模型训练的数据文件。

说明

单条训练语料不要超过100个字符。

自学习--上传数据.jpg

4.模型训练

选择用于模型训练的数据文件,开始模型训练,模型训练时间约3到5小时。

自学习--选择数据.jpg

模型训练完成后,系统会给出模型BLEU参考值。BLEU参考值越高,代表翻译质量越好,具体对应关系详见下图。

bleu值.jpg

image

5.词典干预

上传针对性的干预词典,提升模型翻译质量。

自学习--上传词典按钮.jpg

6.模型测试及调用

模型训练完成后点击发布按钮,发布定制模型。

发布模型.jpg

发布完成后,可对模型进行测试。

自学习--测试模型.jpg

1.原文、2.通用模型翻译结果、3.定制模型翻译结果

自学习--测试模型22

根据定制版翻译引擎调用指南,完成您的模型调用,请确保在使用该接口前,已充分了解定制版翻译产品的收费方式和价格