机器翻译自学习平台使用指南
机器翻译自学习平台适用于无算法背景,但对非通用领域翻译质量要求较高,且至少有上万条高质量双语语料的用户。适用场景包括,医学专业术语以及专业的表达句式翻译难度较大的医疗领域、对翻译时效性和准确性要求较高,单单依靠人工翻译不能做到时效性和准确性兼顾的金融领域等。
说明
定制模型若想取得明显的效果提升,至少需要1万条高质量双语语料。训练语料越优质、数量级越大,定制模型的效果会越好。
使用流程概述
平台使用指南
1.新建项目
进入机器翻译控制台,选择我的项目栏,点击创建项目按钮新建项目,注意,一个项目可添加多个项目管理员,管理员拥有这个项目下所有权限,可以通过输入阿里云账号添加。
2.新建定制模型
项目创建完成后,点击新建定制模型按钮新建定制模型。
3.数据上传
上传用于模型训练的数据文件。
说明
单条训练语料不要超过100个字符。
4.模型训练
选择用于模型训练的数据文件,开始模型训练,模型训练时间约3到5小时。
模型训练完成后,系统会给出模型BLEU参考值。BLEU参考值越高,代表翻译质量越好,具体对应关系详见下图。
5.词典干预
上传针对性的干预词典,提升模型翻译质量。
6.模型测试及调用
模型训练完成后点击发布按钮,发布定制模型。
发布完成后,可对模型进行测试。
1.原文、2.通用模型翻译结果、3.定制模型翻译结果
根据定制版翻译引擎调用指南,完成您的模型调用,请确保在使用该接口前,已充分了解定制版翻译产品的收费方式和价格。