文档

批量智能一键成片参数说明

更新时间:

本文向您介绍批量智能一键成片常用的合成参数。更多最佳实践,请参考如何实现批量智能一键成片

InputConfig 参数说明

说明

支持脚本化自动成片的区域:华东2(上海)、华北2(北京)、华东1(杭州)、华南1(深圳)。

支持智能图文匹配成片的区域:华东2(上海)、华北2(北京)、华东1(杭州)。

参数

类型

说明

是否必填

MediaGroupArray

List<MediaGroup>

脚本化自动成片模式。输入为脚本化素材,支持设置分组名、素材列表

分组名:不超过50个字符,不支持emoji。

素材列表:媒资ID或素材OSS URL。

最多40个分组,每组最多200个素材。

否,MediaGroupArray和MediaArray 二选一必填

MediaArray

List<String>

智能图文匹配模式。支持传入媒资ID或素材OSS URL列表,视频总时长最多两小时。

当MediaGroupArray和MediaArray 同时传入时,优先取用MediaGroupArray。

否,MediaGroupArray和MediaArray 二选一必填

Title

String

标题, 不超过20字。

都填写时优先取用TitleArray

TitleArray

List<String>

标题数组,每次合成随机选一个

最多50个,每个标题不超过20字

SpeechText

String

口播文案,最长1000个字符。

都填写时优先取用SpeechTextArray

SpeechTextArray

List<String>

口播文案数组,每次合成随机选一个。

最多50个,每条口播文案最长1000个字符。

Sticker

Sticker

贴纸、logo、水印

都填写时优先取用StickerArray

StickerArray

List<Sticker>

贴纸数组,每次合成随机选一个。

最多50个。

BackgroundMusic

String

背景音乐媒资ID 或 OSS URL。

都填写时优先取用BackgroundMusicArray

BackgroundMusicArray

List<String>

背景音乐数组,每次合成随机选一个。

最多50个,支持媒资ID 或 OSS URL。

MediaGroup 参数说明

参数

类型

说明

是否必填

GroupName

String

分组名

不超过50个字符,不支持emoji。

MediaArray

List<String>

素材列表,支持 mediaId 或 url。

最多40个分组,每组最多200个素材。

Sticker 参数说明

参数

类型

说明

是否必填

MediaId

String

贴纸、logo、水印等图片ID

二选一必填

都填写时优先取用MediaId

MediaURL

String

图片URL,仅支持自有OSS

X

Float

参考VideoTrackClip.X

Y

Float

参考VideoTrackClip.Y

Width

Float

参考VideoTrackClip.Width

Height

Float

参考VideoTrackClip.Height

InputConfig 参数示例

脚本化素材混剪模式

{
  "MediaGroupArray": [
    {
      "GroupName": "UseMediaId",
      "MediaArray": [
        "****9d46c886b45481030f6e****",
        "****c886810b4549d4630f6e****"
      ]
    },
    {
      "GroupName": "UseOssUrl",
      "MediaArray": [
        "http://test-bucket.oss-cn-shanghai.aliyuncs.com/test1.mp4",
        "http://test-bucket.oss-cn-shanghai.aliyuncs.com/test2.png"
      ]
    }
  ],
  "Title": "回龙观盒马鲜生开业啦",
  "TitleArray": [
    "回龙观盒马鲜生开业啦",
    "盒马鲜生开业啦"
  ],
  "SpeechText": "附近的商场新开了一家盒马鲜生,今天是第一天开业,赶紧来凑热闹,这家盒马面积不大,但商场里的人不少,零食、酒水都比较便宜,排队的人都排成了长龙,大家也快来看看呀",
  "SpeechTextArray": [
    "附近的商场新开了一家盒马鲜生,今天是第一天开业,赶紧来凑热闹,这家盒马面积不大,但商场里的人不少,零食、酒水都比较便宜,排队的人都排成了长龙,大家也快来看看呀",
    "附近的商场新开了一家盒马鲜生,今天是第一天开业,赶紧来凑热闹"
  ],
  "Sticker": {
    "MediaId": "****b681034549d46c880f6e****",
    "X": 10,
    "Y": 100,
    "Width": 300,
    "Height": 300
  },
  "StickerArray": [
    {
      "MediaId": "****9d46c8b4548681030f6e****",
      "X": 10,
      "Y": 100,
      "Width": 300,
      "Height": 300
    },
    {
      "MediaURL": "http://test-bucket.oss-cn-shanghai.aliyuncs.com/test3.png",
      "X": 10,
      "Y": 100,
      "Width": 300,
      "Height": 300
    }
  ],
  "BackgroundMusic": "****b4549d46c88681030f6e****",
  "BackgroundMusicArray": [
    "****b4549d46c88681030f6e****",
    "****549d46c88b4681030f6e****",
    "http://test-bucket.oss-cn-shanghai.aliyuncs.com/test4.mp3"
  ]
}

智能图文匹配模式

{
  "MediaArray": [
    "****9d46c886b45481030f6e****",
    "****c886810b4549d4630f6e****",
    "http://test-bucket.oss-cn-shanghai.aliyuncs.com/test1.mp4",
    "http://test-bucket.oss-cn-shanghai.aliyuncs.com/test2.png"
  ],
  "Title": "回龙观盒马鲜生开业啦",
  "TitleArray": [
    "回龙观盒马鲜生开业啦",
    "盒马鲜生开业啦"
  ],
  "SpeechText": "附近的商场新开了一家盒马鲜生,今天是第一天开业,赶紧来凑热闹,这家盒马面积不大,但商场里的人不少,零食、酒水都比较便宜,排队的人都排成了长龙,大家也快来看看呀",
  "SpeechTextArray": [
    "附近的商场新开了一家盒马鲜生,今天是第一天开业,赶紧来凑热闹,这家盒马面积不大,但商场里的人不少,零食、酒水都比较便宜,排队的人都排成了长龙,大家也快来看看呀",
    "附近的商场新开了一家盒马鲜生,今天是第一天开业,赶紧来凑热闹"
  ],
  "Sticker": {
    "MediaId": "****b681034549d46c880f6e****",
    "X": 10,
    "Y": 100,
    "Width": 300,
    "Height": 300
  },
  "StickerArray": [
    {
      "MediaId": "****9d46c8b4548681030f6e****",
      "X": 10,
      "Y": 100,
      "Width": 300,
      "Height": 300
    },
    {
      "MediaURL": "http://test-bucket.oss-cn-shanghai.aliyuncs.com/test3.png",
      "X": 10,
      "Y": 100,
      "Width": 300,
      "Height": 300
    }
  ],
  "BackgroundMusic": "****b4549d46c88681030f6e****",
  "BackgroundMusicArray": [
    "****b4549d46c88681030f6e****",
    "****549d46c88b4681030f6e****",
    "http://test-bucket.oss-cn-shanghai.aliyuncs.com/test4.mp3"
  ]
}

EditingConfig 参数说明

用户可通过配置EditingConfig,指定成片素材的音量、位置及其他合成参数。如无特殊需求,建议客户使用默认配置,该字段可置空。

参数

类型

说明

是否必填

MediaConfig

JSON

输入视频素材相关配置。

支持字段:

  • Volume: 输入视频的音量。取值:[0, 10.0],支持小数,例:0.5。

TitleConfig

JSON

标题相关配置。支持配置字幕参数,字段详见:横幅文字

SpeechConfig

JSON

口播文案相关配置。

支持字段:

  • Volume:口播音频的音量。取值:[0, 10.0],支持小数,例:0.5。

  • AsrConfig:支持配置字幕参数,字段详见:横幅文字

  • Voice:指定单个或多个口播音色。当指定多个voice时,会随机选取一个合成。例:"zhimiao_emo,zhilun"。

  • SpeechRate:语速,取值范围:-500~500,默认值:0。

    • [-500, 0, 500] 对应的语速倍速区间为 [0.5, 1.0, 2.0]。

说明

计算方法如下:

  • 0.8倍速(1-1/0.8)/0.002 = -125

  • 1.2倍速(1-1/1.2)/0.001 = 166

小于1倍速时,使用0.002系数。

大于1倍速时,使用0.001系数。

实际算法结果取近似值。

  • Style:口播声音风格,默认为空。若同时指定Voice和Style,则优先取用Voice。取值:

    • "Gentle": 柔和

    • "Serious":严肃

    • "Entertainment":娱乐

BackgroundMusicConfig

JSON

背景音乐相关配置。

支持字段:

  • Volume:背景音乐的音量。取值:[0, 10.0],支持小数,例:0.5。

  • Style:背景音乐风格,默认为空。若InputConfig中已配置背景音乐,此字段不生效。取值:

    • "bgm-beauty":时尚

    • "bgm-chinese-style":中国风

    • "bgm-cuisine":美食

    • "bgm-dynamic":动感

    • "bgm-quirky":怪诞

    • "bgm-relaxing":轻松

    • "bgm-romantic":浪漫

    • "bgm-upbeat":欢快

ProcessConfig

混剪处理配置。

支持字段:

  • SingleShotDuration:长视频素材进行剪辑时会自动拆条,拆条后单镜头的时长。

  • AllowVfxEffect:是否允许添加特效效果

  • AllowDuplicateMatch:仅智能图文匹配模式生效,表示匹配过的片段是否允许重复使用。

  • AlignmentMode:仅脚本化剪辑模式生效,表示视频和口播文案的对齐模式。取值:

    • "AutoSpeed":视频轨道时长按照音频轨道缩放,默认。

    • "Cut":视频轨道时长按照音频轨道截断。

ProduceConfig

JSON

普通剪辑合成配置,字段详见:EditingProduceConfig

EditingConfig 参数示例

EditingConfig 中的所有参数均为非必填项,以下是默认配置:

{
  "MediaConfig": {
    "Volume": 0 // 默认视频素材静音
  },
  "TitleConfig": {
    "Alignment": "TopCenter",
    "AdaptMode": "AutoWrap",
    "Font": "Alibaba PuHuiTi 2.0 95 ExtraBold",
    "SizeRequestType": "Nominal",
    "Y": 0.1, // 成片为竖屏时,标题Y坐标值
    "Y": 0.05, // 成片为横屏时,标题Y坐标值
    "Y": 0.08 // 成片为方屏时,标题Y坐标值
  },
  "SpeechConfig": {
    "Volume": 1,  // 口播音频默认用原始音量
    "SpeechRate": 0,
    "Voice": null,
    "Style": null,
    "AsrConfig": {
      "Alignment": "TopCenter",
      "AdaptMode": "AutoWrap",
      "Font": "Alibaba PuHuiTi 2.0 65 Medium",
      "SizeRequestType": "Nominal",
      "Spacing": -1,
      "Y": 0.8, // 成片为竖屏时,字幕Y坐标值
      "Y": 0.9, // 成片为横屏时,字幕Y坐标值
      "Y": 0.85 // 成片为方屏时,字幕Y坐标值
    }
  },
  "BackgroundMusicConfig": {
    "Volume": 0.3,   // 背景音乐默认用30%音量,
    "Style": null
  },
  "ProcessConfig": {
    "SingleShotDuration": 3,      // 拆条后的镜头时长
    "AllowVfxEffect": true,				// 是否添加特效效果
    "AllowDuplicateMatch": false, // 图文匹配模式下,匹配过的片段是否允许重复使用
    "AlignmentMode": "AutoSpeed" // 脚本化剪辑模式下,主轨道缩放AutoSpeed/截断对齐Cut
  }
}

OutputConfig 参数说明

参数

类型

必填

说明

MediaURL

String

成片输出到OSS时必填

输出视频地址,必须要有占位符

如:http://xxx.oss-cn-shanghai.aliyuncs.com/xxx_{index}.mp4

StorageLocation

String

成片输出到VOD时必填

指定输出到VOD的媒资文件存储地址

如:outin-xxxxxx.oss-cn-shanghai.aliyuncs.com

FileName

String

成片输出到VOD时必填

输出文件名称,必须要有占位符,

如:xxx_{index}.mp4

Count

Integer

否,默认1

输出视频数,数量上限为100。

MaxDuration

Float

输出视频单片时长上限。

如果有确定「口播文本」参数,以口播文本tts时长为准,当前参数无效;

如果无「口播文本」,以当前设置单片时长为最大时长,默认15s。

Width

Integer

成片宽,px

Height

Integer

成片高,px

Video

JSONObject

输出视频流相关配置,Crf、Codec等

OutputConfig 参数示例

{
 	"MediaURL": "http://xxx.oss-cn-shanghai.aliyuncs.com/xxx_{index}.mp4",
 	"Count": 20,
 	"MaxDuration": 15,
 	"Width": 1080,
 	"Height": 1920,
 	"Video": {"Crf": 27}
}

  • 本页导读 (1)
文档反馈