视频翻译参数介绍与示例

本文介绍了有关视频翻译接口 SubmitVideoTranslationJob 的参数与示例。

参数说明

参数名

类型

必填项

名称

描述

InputConfig

String

输入配置

  • JSON 格式字符串

  • 内部参数见下方

OutputConfig

String

输出配置

  • JSON 格式字符串

  • 内部参数见下方

EditingConfig

String

翻译配置

  • JSON 格式字符串

  • 内部参数见下方

Title

String

标题

Description

String

描述

UserData

String

自定义信息

InputConfig

参数名

类型

必填项

名称

描述

Type

String

输入类型

  • 取值范围:

    • Video 视频

    • Audio 音频

    • Subtitle 字幕

Video

String

视频媒资 Id 或地址

  • Type 为 Video 时传入

  • 支持传入:

    • 媒资 Id

    • 本账号下的 OSS 地址

    • 其它公网可访问的地址

Audio

String

音频媒资 Id 或地址

  • Type 为 Audio 时传入

  • 支持传入:

    • 媒资 Id

    • 本账号下的 OSS 地址

    • 其它公网可访问的地址

Subtitle

String

字幕媒资 Id 或地址

  • Type 为 Subtitle 时传入

  • 支持传入:

    • 媒资 Id

    • 本账号下的 OSS 地址

    • 其它公网可访问的地址

OutputConfig

参数名

类型

必填项

名称

描述

MediaURL

String

输出地址

  • 填写本账号下的 OSS 地址

  • 路径中请附带扩展名,会依据扩展名判断输出类型,扩展名支持:

    • mp4

EditingConfig

参数名

类型

必填项

名称

描述

SourceLanguage

String

原语言

原语言对应的代码,例如zh

取值范围:

  • 字幕级翻译

    • zh:中文

    • en:英文

  • 语音级翻译

    • zh:中文

    • en:英语

    • ja:日语

    • ko:韩语

    • yue:粤语

    • de:德语

    • fr:法语

    • es:西班牙语

    • ar:阿拉伯语

    • it:意大利语

    • az:阿塞拜疆语

    • be:白俄罗斯语

    • bg:保加利亚语

    • bn:孟加拉语

    • bs:波斯尼亚语

    • bn:孟加拉语

    • cs:捷克语

    • cy:威尔士语

    • da:丹麦语

    • et:爱沙尼亚语

    • fa:波斯语

    • hi:印地语

    • hbs:克罗地亚语

    • hu:匈牙利语

    • id:印度尼西亚语(印尼语)

    • is:冰岛语

    • lt:立陶宛语

    • lv:拉脱维亚语

    • mi:毛利语

    • mn:蒙古语

    • mr:马拉地语

    • ms:马来语

    • mt:马耳他语

    • ne:尼泊尔语

    • nl:荷兰语

    • no:挪威语

    • pl:波兰语

    • pt:葡萄牙语

    • ro:罗马尼亚语

    • ru:俄语

    • sk:斯洛伐克语

    • sl:斯洛文尼亚语

    • sq:阿尔巴尼亚语

语言代码对照实际以语言代码列表为准

TargetLanguage

String

翻译目标语言

目标语言对应的代码,例如en

取值范围:

  • 字幕级翻译:

    • zh:中文

    • en:英语

    • ja:日语

    • id:印尼语(印度尼西亚语)

    • es:西班牙语

    • pt:葡萄牙语

    • ar:阿拉伯语

    • fr:法语

    • tr:土耳其语

    • yue:粤语

    • de:德语

    • ko:韩语

  • 语音级翻译:

    • zh:中文

    • en:英语

    • ja:日语

    • ko:韩语

    • yue:粤语

    • de:德语

    • fr:法语

    • es:西班牙语

    • ar:阿拉伯语

    • tr:土耳其语

    • pt:葡萄牙语

    • vi:越南语

    • ms:马来语

    • th:泰语

    • id:印度尼西亚语

语言代码对照实际以语言代码列表为准

DetextArea

String

设置字幕擦除

  • 不填则不进行字幕擦除

  • 取值范围:

    • Auto:自动识别擦除区域

    • [[x, y, width, height]]:指定擦除范围,格式为二层数组,可指定多个擦除区域,其中:

      • x:字幕框左上角距离视频左上角的横向距离比例,取值范围:[0, 1]

      • y:字幕框左上角距离视频左上角的竖向距离比例,取值范围:[0, 1]

      • width:字幕框宽度相对于视频宽度的比例,取值范围:[0, 1]

      • height:字幕框高度相对于视频高度的比例,取值范围:[0, 1]

SupportEditing

Boolean

是否支持二次编辑

  • 取值范围:

    • true:支持

    • false:不支持

  • 默认值:false

SubtitleTranslate

String

字幕级翻译配置

  • 字幕级翻译配置

  • 填入此参数,则进行字幕级翻译,否则不进行字幕级翻译

  • 字符串符合 JSON 格式,详细入参介绍见下方

NeedSpeechTranslate

Boolean

是否需要语音级翻译

  • 取值范围:

    • true:是

    • false:否

  • 默认值:false

SpeechTranslate

String

语音级翻译配置

  • 语音级翻译配置

  • NeedSpeechTranslate 为 true 或填入此参数时,则进行语音级翻译,否则不进行语音级翻译

  • 字符串符合 JSON 格式,详细入参介绍见下方

SubtitleTranslate

名称

类型

必填项

名称

描述

OcrArea

String

OCR 识别区域

  • 不填默认为智能识别字幕区域

  • 取值范围:

  • Auto:自动识别字幕区域

  • [x, y, width, height]:指定字幕区域,格式为单层数组,只能指定 1 个区域,其中:

    • x:字幕框左上角距离视频左上角的横向距离比例,取值范围:[0, 1]

    • y:字幕框左上角距离视频左上角的竖向距离比例,取值范围:[0, 1]

    • width:字幕框宽度相对于视频宽度的比例,取值范围:[0, 1]

    • height:字幕框高度相对于视频高度的比例,取值范围:[0, 1]

SubtitleConfig

String

字幕合成配置

  • 用于自定义成片字幕效果,参数与剪辑合成中 Timeline 的 SubtitleTrackClip 中字幕参数一致,参考:SubtitleTrackClip

  • 字幕级翻译的字幕样式将根据OCR识别到的字幕大小进行自适应调整。

SpeechTranslate

名称

类型

必填项

名称

描述

BilingualSubtitle

Boolean

开启双语字幕

  • 用于指定是否要输出双语字幕

  • 取值范围:{true, false}

  • 默认值 false

  • 默认输出目标语言单语种字幕,设置为 true 时,改为输出双语种字幕

SubtitleConfig

String

字幕合成配置

  • 用于自定义成片字幕效果,参数与剪辑合成中 Timeline 的 SubtitleTrackClip 中字幕参数一致,参考:SubtitleTrackClip

  • 如果希望语音级翻译输出的成片不显示字幕,则可以不传SubtitleTrackClip.FontSize的值或者设置为0

OriginalJobId

String

原任务 Id

  • 如果对翻译效果不满意,可以在 InputConfig.Subtitle 传入人工修改后的字幕文件,并且在此字段中传入原任务 Id 来重新生成翻译语音

  • 设置 SupportEditing 为 true 时(开启支持编辑),在任务结果中会包含 SpeechTranslationJobId,二次修正翻译时,将此值填入 OriginalJobId 中

  • 设置 SupportEditing 为 true 时(开启支持编辑),在任务结果中会包含 会包含翻译后的字幕文件 SpeechTranslatedSubtitleURL,请在此文件内容的基础上进行修改,并在二次编辑时传入 InputConfig.Subtitle 中

场景示例

语音翻译 - 人工修正

背景说明

如果对语音翻译的结果不满意,可以通过人工修正字幕文件的方式,二次提交翻译进行修正。

流程描述

进行首次提交语音翻译(注意:如果需要后续支持人工修正,需要设置SupportEditingtrue),完整参数示例如下:

{
    "InputConfig": {
        "Type": "Video",
        "Video": "*****a0052ff71efbfd4e7e6c66*****"
    },
    "OutputConfig": {
        "MediaURL": "https://your-bucket.oss-cn-shanghai.aliyuncs.com/video.mp4"
    },
    "EditingConfig": {
        "SourceLanguage": "zh",
        "TargetLanguage": "en",
        "SupportEditing": true,
        "NeedSpeechTranslate": true
    }
}

首次提交语音翻译结果如下:

{
    "MediaId": "*****d306b6d71efbf98f6f7f55*****",
    "TranslatedAudioMediaId": "*****d306b6d71efbf98f6f7f5*****",
    "SpeechTranslatedSubtitleURL": "http://your-bucket.oss-cn-shanghai.aliyuncs.com/video_subtitle_asr_en.srt",
    "SpeechTranslationJobId": "*****74f329d4c03b63e7f7dac8*****"
}

其中:

  1. MediaId:成片的媒资 Id;

  2. TranslatedAudioMediaId:语音翻译得到的音频媒资 Id;

  3. SpeechTranslatedSubtitleURL:语音翻译得到的字幕文件地址;

  4. SpeechTranslationJobId:语音翻译的 JobId,人工修正时填入的 OriginalJobId 需要依赖此值。

如果对翻译效果不满意,请下载SpeechTranslatedSubtitleURL中的字幕文件,并对字幕文件中的内容进行修改,再次提交语音翻译,本次语音翻译会根据修改后的字幕内容进行重新生成音频。

重要

请仅针对 srt 文件中的文字内容信息进行修改,而不要修改字幕的时间或增加字幕条数。

二次修正时参数示例如下,主要包括原视频,修正后的字幕文件,原音频翻译任务 Id:

{
    "InputConfig": {
        "Type": "Video",
        "Video": "*****a0052ff71efbfd4e7e6c66*****",
        "Subtitle": "https://your-bucket.oss-cn-shanghai.aliyuncs.com/new_subtitle.srt"
    },
    "OutputConfig": {
        "MediaURL": "https://your-bucket.oss-cn-shanghai.aliyuncs.com/video.mp4"
    },
    "EditingConfig": {
        "SourceLanguage": "zh",
        "TargetLanguage": "en",
        "SupportEditing": true,
        "NeedSpeechTranslate": true,
        "SpeechTranslate": {
            "OriginalJobId": "*****b5d5d604916bb898b3066*****"
        }
    }
}