文档

音频拼接

更新时间:

您可以通过音频拼接功能,将多个音频拼接为一个音频并转换为需要的格式。本文介绍音频拼接功能参数及示例。

使用场景

  • 音乐创作与制作:音乐人和制作人在创作歌曲时,可能会将多个独立录制的乐器或人声部分拼接起来,形成完整的曲目。

  • 有声读物和语音内容创作:有声书制作时,往往将一段段朗读音频按照章节顺序拼接起来,确保故事连贯性。

  • 影视后期制作:在电影、电视剧或者动画片制作过程中,音频编辑师需将对话、旁白、环境音效以及配乐等多种音频元素拼接,以匹配视频画面。

  • 社交媒体内容创作:用户在短视频平台上传自创内容时,可能会将多种声音效果、旁白和背景音乐拼接在一起,以增加内容的表现力。

注意事项

  • 音频拼接仅支持异步处理(x-oss-async-process处理方式)。

  • 使用音频拼接前,需要先绑定IMM Project。关于控制台和API如何绑定,请参见快速入门AttachOSSBucket

  • 不支持匿名访问。

  • 必须拥有IMM处理所需的相关权限。更多信息,请参见权限

  • 当使用默认采样率或声道数进行拼接时,拼接可能由于目标音频容器的兼容性而失败。

参数说明

操作名称:audio/concat

具体参数如下表所示。

拼接参数

audio/concat的拼接顺序按照presur在请求串中的先后顺序进行拼接,具体如下:

  • /pre:前置拼接的音频文件。

  • /sur:后置拼接的音频文件。

参数

类型

是否必须

描述

ss

int

前缀,后缀音频的拼接起始时间,单位为毫秒。取值:

  • 0(默认值):从起始位置开始。

  • 大于0:从第ss毫秒开始。

t

int

前缀,后缀音频的拼接持续时长,单位为毫秒。取值:

  • 0(默认值):持续到结束位置。

  • 大于0:持续t毫秒。

o

string

当前Bucket下的OSS Object,需要以Base64 URL安全方式编码。

转码参数

参数

类型

是否必须

描述

ss

int

被拼接音频的拼接起始时间,单位为毫秒。取值:

  • 0(默认值):从起始位置开始。

  • 大于0:从第ss秒开始。

t

int

被拼接音频的拼接持续时长,单位为毫秒。取值:

  • 0(默认值):持续到结束位置。

  • 大于0:持续t毫秒。

f

string

音频容器:

  • mp3

  • aac

  • flac

  • oga

  • ac3

  • opus

  • amr

ar

int

音频采样率。默认与align指定的源音频一致,取值:

  • 8000

  • 11025

  • 12000

  • 16000

  • 22050

  • 24000

  • 32000

  • 44100

  • 48000

  • 64000

  • 88200

  • 96000

说明

不同格式支持的采样率有所不同,mp3仅支持48kHz及以下;opus支持8kHz、12kHz、16kHz、24kHz与48kHz;ac3支持32kHz、44.1kHz与48kHz;amr仅支持8kHz与16kHz。

ac

int

音频声道数。默认与align指定的源音频一致,取值范围:1~8。

说明

不同格式支持的声道数有所不同,mp3仅支持单、双声道;ac3最大支持6声道(5.1);amr仅支持单声道。

aq

int

音频压缩质量。取值范围:0~100。

说明

该参数与ab互斥,若都不设置则按照编码器默认码率进行编码。

ab

int

音频比特率(码率)。单位为比特/秒(bps)。取值范围:1000~10000000。

abopt

string

音频码率选项。取值:

  • 0(默认值):始终使用目标音频码率。

  • 1:拼接列表中存在源音频码率小于ab时使用拼接列表中最小的源音频码率。

  • 2:拼接列表中存在源音频码率小于ab时返回失败。

说明

该参数需要与ab一同设置。

align

int

主音频文件(提供默认转码参数)在拼接列表中的序号,默认为0(对齐拼接列表中第一个音频)。

说明

音频拼接时也会用到sys/saveasnotify参数。更多信息,请参见另存为消息通知

使用REST API

将5段不同格式音频拼接为1段AAC格式音频

拼接信息

  • 拼接前

    • 音频名称:pre1.mp3,pre2.wav,example.oga,sur1.aac,sur2.wma

  • 处理方式

    • 拼接时长与顺序:

      音频名称

      顺序

      时长

      pre1.mp3

      1

      整段音频

      pre2.wav

      2

      前2秒

      example.oga

      3

      整段音频

      sur1.aac

      4

      第4秒到第十秒

      sur2.wma

      5

      第10秒到结尾

    • 转码完成消息通知:发送MNS消息

  • 拼接后

    • 音频信息

      • 音频格式:aac

      • 音频配置:44.1kHz采样率,单声道

      • 音频码率:96 Kbps

    • 文件存储路径

      • aac文件:oss://outbucket/outobj.aac

处理示例

// 对文件example.oga进行音频拼接。
POST /exmaple.oga?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: OSS qn6qrrqxo2oawuk53otf****:UNQDb7GapEgJkcde6OhZ9J****

x-oss-async-process=audio/concat,f_aac,ac_1,ar_44100,ab_96000,align_2/pre,o_cHJlMS5tcDMK/pre,o_cHJlMi53YXYK,t_2000/sur,o_c3VyMS5hYWMK,ss_4000,t_10000/sur,o_c3VyMi53bWEK,ss_10000|sys/saveas,b_b3V0YnVja2V0,o_b3V0b2JqLnthdXRvZXh0fQo/notify,topic_QXVkaW9Db252ZXJ0

使用SDK

音频拼接仅支持异步处理,SDK使用方法请参见使用SDK

  • 本页导读 (1)
文档反馈