视频翻译技术利用人工智能和机器学习算法,能够高效、准确地将视频内容从源语言转换为一种或多种目标语言,以便跨语言用户能够理解视频内容。这项技术不仅涵盖字幕翻译,还包括语音翻译,确保翻译后的内容在视觉和听觉上的一致性与自然性。同时,它能够跨越语言障碍,丰富教育内容,提升娱乐体验,从而极大地促进跨文化交流。
功能特性
智能媒体服务所提供的视频翻译服务,支持字幕级翻译及语音级翻译,并计划在未来扩展至面容级翻译,为您提供高效、专业的视频翻译解决方案。其主要功能特性包括:
翻译级别 | 功能描述 |
字幕级 | 字幕级翻译是指将视频中的字幕文本提取出来,并将其翻译成目标语言。翻译后的字幕可以重新嵌入到视频中,或者以独立的字幕文件形式提供。 |
语音级 | 语音级翻译是指将视频中的语音内容转换为文本,然后将文本翻译成目标语言。翻译后的文本可以通过语音合成技术生成目标语言的语音,并替换原视频中的语音。 |
创建视频翻译任务
登录EchoMind。
在左侧导航栏选择
。在视频翻译页签下,单击创建任务按钮进入到创建视频翻译任务页面。
根据页面提示,完成参数设置:
任务类型:支持字幕翻译或语音级翻译。
源文件类型:
字幕级翻译:支持的源文件类型包括视频和字幕文件。
语音级翻译:支持的源文件类型包括视频和音频文件。
字幕来源:
文字识别:通过OCR技术从视频中提取字幕文本。
字幕文件:直接使用提供的字幕文件进行翻译。
翻译语言:支持多种语言的翻译,用户可以选择源语言和目标语言。
高级配置:包括是否在翻译后的视频中擦除原字幕、或设置输出目标字幕类型。
单语字幕:提供仅含目标语言的字幕,适合单一语言观众群体。
双语字幕:同时显示源语言和目标语言的字幕,满足多语言观众需求或用于语言学习。
不添加字幕:不对视频添加任何字幕,适用于无需字幕或计划采用其他语言转换方式的情形。
源文件上传。
单击添加源文件,上传需要翻译的视频文件、字幕文件或音频文件。
确认所有参数无误后,单击下一步进行任务设置。
支持您设置目标字幕样式、文字识别、字幕擦除。同时,您可以保存当前配置为预设模板,或者将此配置应用到所有相关任务设置中。这样可以简化后续任务的配置流程,提高工作效率。
配置项
描述
目标字幕样式
支持进行基础的字幕样式调整以及设置花字效果。
基础字幕样式:
字体大小:根据视频的画面尺寸和个人偏好,选择合适的字体大小。
字体颜色与边框:提供多种选项以保证不同背景色下字幕的可读性。
位置与对齐方式:指定字幕出现的位置及对齐方式,适应不同的视觉需求。
花字:为字幕设置不同的花字效果,以吸引观众的注意。
文字识别
智能识别:利用先进的OCR技术和自然语言处理算法自动从视频中提取字幕文本。
手动框选:对于智能识别无法准确完成的情况,比如字幕与背景融合严重或存在非标准字体时,用户可以通过手动框选的方式精确地选定需要识别的字幕区域。
字幕擦除
不擦除:保持原视频中的字幕不变,仅生成新的翻译后的字幕文件。
智能识别:使用智能算法检测并移除原视频中的字幕。
手动框选:提供工具让用户手动标记需要删除的字幕部分,然后应用算法进行擦除处理。
单击开始翻译任务,提交任务。
查看翻译任务
您可以在视频翻译页面,查看视频翻译任务列表,包括任务状态、翻译类型、异常/完成/总数,当任务状态变更为处理完成时,单击操作列的查看以获取任务的基础设施、高级设置以及翻译输出结果。
控制台、OpenAPI相关文档
除了上述使用方式,还提供了通过OpenAPI和控制台实现一键生成的功能。具体信息请参见: