双语对齐

更新时间:
复制为 MD 格式

您可以通过双语对齐功能,将原文+译文文档进行句对齐,对齐后可以导入到语料库中,作为语料使用。

使用场景

当您手里已经有翻译好的译文文档,和对应的原文文档,并且期望导入到平台的语料库中,作为语料使用,可以使用双语对齐功能,快速的生成历史语料

使用方式

  1. 点击工具箱 -> 双语对齐,并点击右上角的创建对齐项目的按钮

  1. 选择、填写表单,并上传对应的文件(双文档对齐指的是原文文档和对应的译文文档,单文档对齐指的是双语文案在同一个里面的文档)

表单包含项目名称语言方向文件类型选择源文件备注字段。支持的文件扩展名包括 .doc.docx.xlsx.txt.zip,其中 Excel 文件同时支持上下和左右对照的单文档对齐。

  1. 等待一段时间,状态变为自动处理完成后,可以点击手动对齐进行人工修正

项目列表中,当状态列显示自动处理完成时,对应行的操作列将出现手动对齐入口按钮。

  1. 在对齐工作台中, 可以通过对原文、译文的编辑,来处理不正确的原文和译文。

对齐工作台顶部工具栏提供 UndoRedoMergeSplitInsertDelete 操作按钮,每条对齐条目的 Operation 列支持 Move UpMove DownDelete 操作。

  1. 全部完成后,可以点击右上角的完成按钮

系统弹出确认对话框,提示完成后任务将被设置为已完成状态,但仍可继续编辑,单击确认完成任务。

  1. 当点击完成后,列表将会变为手动处理完成状态,可以点击导入语料导入到选择的语料库中

导入语料对话框中,重复原文导入设置提供三种处理策略:合并句对覆盖不导入。选择完成后单击导入

  1. 点击导出按钮,可以导出TMX文件