视频内容源语言到目标语言转换-视频翻译-智能媒体服务-阿里云-智能媒体服务(IMS)-阿里云帮助中心

视频翻译技术利用人工智能和机器学习算法，能够高效、准确地将视频内容从源语言转换为一种或多种目标语言，以便跨语言用户能够理解视频内容。这项技术不仅涵盖字幕翻译，还包括语音翻译，确保翻译后的内容在视觉和听觉上的一致性与自然性。同时，它能够跨越语言障碍，丰富教育内容，提升娱乐体验，从而极大地促进跨文化交流。

功能特性

智能媒体服务所提供的视频翻译服务，支持字幕级翻译及语音级翻译，并计划在未来扩展至面容级翻译，为您提供高效、专业的视频翻译解决方案。其主要功能特性包括：

翻译级别	功能描述
字幕级	字幕级翻译是指将视频中的字幕文本提取出来，并将其翻译成目标语言。翻译后的字幕可以重新嵌入到视频中，或者以独立的字幕文件形式提供。
语音级	语音级翻译是指将视频中的语音内容转换为文本，然后将文本翻译成目标语言。翻译后的文本可以通过语音合成技术生成目标语言的语音，并替换原视频中的语音。

创建视频翻译任务

登录EchoMind。
在左侧导航栏选择媒体处理 > 视频翻译。
在视频翻译页签下，单击创建任务按钮进入到创建视频翻译任务页面。
根据页面提示，完成参数设置：
- 任务类型：支持字幕翻译或语音级翻译。
- 源文件类型：
  - 字幕级翻译：支持的源文件类型包括视频和字幕文件。
  - 语音级翻译：支持的源文件类型包括视频和音频文件。
- 字幕来源：
  - 文字识别：通过OCR技术从视频中提取字幕文本。
  - 字幕文件：直接使用提供的字幕文件进行翻译。
- 翻译语言：支持多种语言的翻译，用户可以选择源语言和目标语言。
- 高级配置：包括是否在翻译后的视频中擦除原字幕、或设置输出目标字幕类型。
  - 单语字幕：提供仅含目标语言的字幕，适合单一语言观众群体。
  - 双语字幕：同时显示源语言和目标语言的字幕，满足多语言观众需求或用于语言学习。
  - 不添加字幕：不对视频添加任何字幕，适用于无需字幕或计划采用其他语言转换方式的情形。
源文件上传。

单击添加源文件，上传需要翻译的视频文件、字幕文件或音频文件。

确认所有参数无误后，单击下一步进行任务设置。

任务设置页面包含目标字幕样式、文字识别、字幕擦除三大配置区及保存/应用模板入口。其中，基础字幕样式还支持设置自动换行方式（如空格换行）、文本宽度、字间距、行间距、样式（斜体/粗体/下划线）及不透明度，并可选择开启阴影或发光效果。

支持您设置目标字幕样式、文字识别、字幕擦除。同时，您可以保存当前配置为预设模板，或者将此配置应用到所有相关任务设置中。这样可以简化后续任务的配置流程，提高工作效率。

配置项	描述
目标字幕样式	支持进行基础的字幕样式调整以及设置花字效果。基础字幕样式：字体大小：根据视频的画面尺寸和个人偏好，选择合适的字体大小。字体颜色与边框：提供多种选项以保证不同背景色下字幕的可读性。位置与对齐方式：指定字幕出现的位置及对齐方式，适应不同的视觉需求。花字：为字幕设置不同的花字效果，以吸引观众的注意。
文字识别	智能识别：利用先进的OCR技术和自然语言处理算法自动从视频中提取字幕文本。手动框选：对于智能识别无法准确完成的情况，比如字幕与背景融合严重或存在非标准字体时，用户可以通过手动框选的方式精确地选定需要识别的字幕区域。
字幕擦除	不擦除：保持原视频中的字幕不变，仅生成新的翻译后的字幕文件。智能识别：使用智能算法检测并移除原视频中的字幕。手动框选：提供工具让用户手动标记需要删除的字幕部分，然后应用算法进行擦除处理。

单击开始翻译任务，提交任务。

查看翻译任务

您可以在视频翻译页面，查看视频翻译任务列表，包括任务状态、翻译类型、异常/完成/总数，当任务状态变更为处理完成时，单击操作列的查看以获取任务的基础设施、高级设置以及翻译输出结果。

任务列表还包括名称/ID、源文件类型、语言、创建时间、完成时间等列，操作列还支持删除任务。页面顶部提供创建任务按钮，以及按创建时间、日期范围和名称/ID进行筛选的功能。

控制台、OpenAPI相关文档

除了上述使用方式，还提供了通过OpenAPI和控制台实现一键生成的功能。具体信息请参见：