视频翻译

视频翻译技术利用人工智能和机器学习算法,能够高效、准确地将视频内容从源语言转换为一种或多种目标语言,以便跨语言用户能够理解视频内容。这项技术不仅涵盖字幕翻译,还包括语音翻译,确保翻译后的内容在视觉和听觉上的一致性与自然性。同时,它能够跨越语言障碍,丰富教育内容,提升娱乐体验,从而极大地促进跨文化交流。

功能特性

智能媒体服务所提供的视频翻译服务,支持字幕级翻译及语音级翻译,并计划在未来扩展至面容级翻译,为您提供高效、专业的视频翻译解决方案。其主要功能特性包括:

翻译级别

功能描述

字幕级

字幕级翻译是指将视频中的字幕文本提取出来,并将其翻译成目标语言。翻译后的字幕可以重新嵌入到视频中,或者以独立的字幕文件形式提供。

语音级

语音级翻译是指将视频中的语音内容转换为文本,然后将文本翻译成目标语言。翻译后的文本可以通过语音合成技术生成目标语言的语音,并替换原视频中的语音。

创建视频翻译任务

  1. 登录EchoMind

  2. 在左侧导航栏选择媒体处理 > 视频翻译

  3. 视频翻译页签下,单击创建任务按钮进入到创建视频翻译任务页面。

    image

  4. 根据页面提示,完成参数设置:

    • 任务类型:支持字幕翻译或语音级翻译。

    • 源文件类型:

      • 字幕级翻译:支持的源文件类型包括视频和字幕文件。

      • 语音级翻译:支持的源文件类型包括视频和音频文件。

    • 字幕来源:

      • 文字识别:通过OCR技术从视频中提取字幕文本。

      • 字幕文件:直接使用提供的字幕文件进行翻译。

    • 翻译语言:支持多种语言的翻译,用户可以选择源语言和目标语言。

    • 高级配置:包括是否在翻译后的视频中擦除原字幕、或设置输出目标字幕类型。

      • 单语字幕:提供仅含目标语言的字幕,适合单一语言观众群体。

      • 双语字幕:同时显示源语言和目标语言的字幕,满足多语言观众需求或用于语言学习。

      • 不添加字幕:不对视频添加任何字幕,适用于无需字幕或计划采用其他语言转换方式的情形。

  5. 源文件上传。

    单击添加源文件,上传需要翻译的视频文件、字幕文件或音频文件。

  6. 确认所有参数无误后,单击下一步进行任务设置。

    image

    支持您设置目标字幕样式、文字识别、字幕擦除。同时,您可以保存当前配置为预设模板,或者将此配置应用到所有相关任务设置中。这样可以简化后续任务的配置流程,提高工作效率。

    配置项

    描述

    目标字幕样式

    支持进行基础的字幕样式调整以及设置花字效果。

    • 基础字幕样式:

      • 字体大小:根据视频的画面尺寸和个人偏好,选择合适的字体大小。

      • 字体颜色与边框:提供多种选项以保证不同背景色下字幕的可读性。

      • 位置与对齐方式:指定字幕出现的位置及对齐方式,适应不同的视觉需求。

    • 花字:为字幕设置不同的花字效果,以吸引观众的注意。

    文字识别

    • 智能识别:利用先进的OCR技术和自然语言处理算法自动从视频中提取字幕文本。

    • 手动框选:对于智能识别无法准确完成的情况,比如字幕与背景融合严重或存在非标准字体时,用户可以通过手动框选的方式精确地选定需要识别的字幕区域。

    字幕擦除

    • 不擦除:保持原视频中的字幕不变,仅生成新的翻译后的字幕文件。

    • 智能识别:使用智能算法检测并移除原视频中的字幕。

    • 手动框选:提供工具让用户手动标记需要删除的字幕部分,然后应用算法进行擦除处理。

  7. 单击开始翻译任务,提交任务。

查看翻译任务

您可以在视频翻译页面,查看视频翻译任务列表,包括任务状态、翻译类型、异常/完成/总数当任务状态变更为处理完成时,单击操作列的查看以获取任务的基础设施、高级设置以及翻译输出结果。

image

控制台、OpenAPI相关文档

除了上述使用方式,还提供了通过OpenAPI和控制台实现一键生成的功能。具体信息请参见: