音频转码

您可以通过音频转码功能,将音频转换为需要的格式。本文介绍音频转码处理功能参数及示例。

使用场景

  • 音乐文件格式转换:用户从网络下载的音乐可能不是其设备或播放器支持的格式,需要转换音频格式才能进行播放。

  • 存储空间优化:高品质无损音频(如FLAC)占用大量存储空间,为了在移动设备上节省空间,用户会选择将其转码为有损但压缩率高的格式,如MP3。

  • 在线流媒体服务:在线音乐平台或广播电台会将原始音频文件转码成多种比特率版本,以适应不同网络条件下的传输需求,保证用户在低带宽环境下也能流畅收听。

  • 视频制作与后期处理:视频编辑时,原始音频素材可能需要根据项目要求进行转码,比如调整采样率、位深度以匹配影片的音轨规格,或者转换成适合于网络传播的压缩格式。

注意事项

  • 音频转码仅支持异步处理(x-oss-async-process处理方式)。

  • 使用音频转码前,需要先绑定IMM Project。关于控制台和API如何绑定,请参见快速入门AttachOSSBucket

  • 不支持匿名访问。

  • 必须拥有IMM处理所需的相关权限。更多信息,请参见权限

  • 当使用默认采样率或声道数进行转码时,转码可能由于目标音频容器的兼容性而失败。

  • 目前音频转码不支持设置音频位深,视频转码支持位深设置,通过OSS x-oss-process方式的pixfmt参数来进行设置,参考视频转码

参数说明

操作名称:audio/convert

具体参数如下表所示。

参数

类型

是否必须

描述

ss

int

起始时间,单位为毫秒。取值:

  • 0(默认值):从起始位置开始。

  • 大于0:从第ss毫秒开始。

t

int

转码时长,单位为毫秒。取值:

  • 0(默认值):持续到结束位置。

  • 大于0:持续t毫秒。

f

string

音频容器:

  • mp3

  • aac

  • flac

  • oga

  • ac3

  • opus

  • amr

ar

int

音频采样率。默认与源音频一致,取值:

  • 8000

  • 11025

  • 12000

  • 16000

  • 22050

  • 24000

  • 32000

  • 44100

  • 48000

  • 64000

  • 88200

  • 96000

说明

不同格式支持的采样率有所不同,mp3仅支持48kHz及以下;opus支持8kHz、12kHz、16kHz、24kHz与48kHz;ac3支持32kHz、44.1kHz与48kHz;amr仅支持8kHz与16kHz。

ac

int

音频声道数。默认与源音频一致,取值范围:1~8。

说明

不同格式支持的声道数有所不同,mp3仅支持单、双声道;ac3最大支持6声道(5.1);amr仅支持单声道。

aq

int

音频压缩质量。与参数ab互斥。取值范围:0~100。

ab

int

音频比特率(码率)。与参数aq互斥,单位为比特/秒(bps)。取值范围:1000~10000000。

abopt

string

音频码率选项。取值:

  • 0(默认值):始终使用目标音频码率。

  • 1:源音频码率小于ab时使用源音频码率。

  • 2:源音频码率小于ab时返回失败。

adepth

int

音频采样位深,取值为16或24。

说明

该参数仅在f为flac时有效

说明

音频转码时也会用到sys/saveasnotify参数。更多信息,请参见另存为消息通知

使用REST API

将MP3格式转换为AAC格式

转码信息

  • 转码前

    • 音频格式:mp3

    • 音频名称:example.mp3

  • 处理方式

    • 转码时长:从输入媒体文件的第1000毫秒开始并持续60000毫秒进行音频转码

    • 转码完成消息通知:发送MNS消息

  • 转码后

    • 音频信息

      • 音频格式:aac

      • 音频配置:保持原有采样率与声道数

      • 音频码率:96 Kbps

    • 文件存储路径

      • aac文件:oss://outbucket/outobjprefix.aac

处理示例

// 对文件example.mp3进行音频转码。
POST /exmaple.mp3?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: OSS qn6q**************:77Dv****************
 
x-oss-async-process=audio/convert,ss_10000,t_60000,f_aac,ab_96000|sys/saveas,b_b3V0YnVja2V0,o_b3V0b2JqcHJlZml4LnthdXRvZXh0fQo/notify,topic_QXVkaW9Db252ZXJ0

将WAV格式转换为OPUS格式

转码信息

  • 转码前

    • 音频格式:wav

    • 音频名称:example.wav

  • 处理方式

    • 转码时长:全部音频

    • 转码完成消息通知:发送MNS消息

  • 转码后

    • 音频信息

      • 音频格式:opus

      • 音频配置:采样率为48kHz,声道为双声道

      • 音频码率:96 Kbps

    • 文件存储路径

      • opus文件:oss://outbucket/outobject.opus

处理示例

// 对文件example.wav进行音频转码。
POST /exmaple.wav?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: OSS qn6q**************:77Dv****************
 
x-oss-async-process=audio/convert,f_opus,ab_96000,ar_48000,ac_2|sys/saveas,b_b3V0YnVja2V0, o_b3V0b2JqLnthdXRvZXh0fQo/notify,topic_QXVkaW9Db252ZXJ0

使用SDK

仅支持使用Java、Python、Go SDK通过异步处理的方式完成音频转码。

Java

要求使用3.17.4及以上版本的Java SDK。

import com.aliyun.oss.ClientBuilderConfiguration;
import com.aliyun.oss.OSS;
import com.aliyun.oss.OSSClientBuilder;
import com.aliyun.oss.common.auth.CredentialsProviderFactory;
import com.aliyun.oss.common.auth.EnvironmentVariableCredentialsProvider;
import com.aliyun.oss.common.comm.SignVersion;
import com.aliyun.oss.model.AsyncProcessObjectRequest;
import com.aliyun.oss.model.AsyncProcessObjectResult;
import com.aliyuncs.exceptions.ClientException;

import java.util.Base64;

public class Demo {
    public static void main(String[] args) throws ClientException {
        // yourEndpoint填写Bucket所在地域对应的Endpoint。
        String endpoint = "https://oss-cn-hangzhou.aliyuncs.com";
        // 填写Endpoint对应的Region信息,例如cn-hangzhou。
        String region = "cn-hangzhou";
        // 从环境变量中获取访问凭证。运行本代码示例之前,请确保已设置环境变量OSS_ACCESS_KEY_ID和OSS_ACCESS_KEY_SECRET。
        EnvironmentVariableCredentialsProvider credentialsProvider = CredentialsProviderFactory.newEnvironmentVariableCredentialsProvider();
        // 指定Bucket名称。
        String bucketName = "examplebucket";
        // 指定转码后的音频文件。
        String targetKey = "dest.aac";
        // 指定原音频文件。
        String sourceKey = "src.mp3";

        // 创建OSSClient实例。
        ClientBuilderConfiguration clientBuilderConfiguration = new ClientBuilderConfiguration();
        clientBuilderConfiguration.setSignatureVersion(SignVersion.V4);
        OSS ossClient = OSSClientBuilder.create()
                .endpoint(endpoint)
                .credentialsProvider(credentialsProvider)
                .clientConfiguration(clientBuilderConfiguration)
                .region(region)
                .build();

        try {
            // 构建音频处理样式字符串以及音频转码处理参数。
            String style = String.format("audio/convert,ss_10000,t_60000,f_aac,ab_96000");
            // 构建异步处理指令。
            String bucketEncoded = Base64.getUrlEncoder().withoutPadding().encodeToString(bucketName.getBytes());
            String targetEncoded = Base64.getUrlEncoder().withoutPadding().encodeToString(targetKey.getBytes());
            String process = String.format("%s|sys/saveas,b_%s,o_%s/notify,topic_QXVkaW9Db252ZXJ0", style, bucketEncoded, targetEncoded);
            // 创建AsyncProcessObjectRequest对象。
            AsyncProcessObjectRequest request = new AsyncProcessObjectRequest(bucketName, sourceKey, process);
            // 执行异步处理任务。
            AsyncProcessObjectResult response = ossClient.asyncProcessObject(request);
            System.out.println("EventId: " + response.getEventId());
            System.out.println("RequestId: " + response.getRequestId());
            System.out.println("TaskId: " + response.getTaskId());

        } finally {
            // 关闭OSSClient。
            ossClient.shutdown();
        }
    }
}

Python

要求使用Python SDK 2.18.4及以上版本。

# -*- coding: utf-8 -*-
import base64
import oss2
from oss2.credentials import EnvironmentVariableCredentialsProvider

def main():
    # 从环境变量中获取访问凭证。运行本代码示例之前,请先配置环境变量。
    auth = oss2.ProviderAuthV4(EnvironmentVariableCredentialsProvider())
    # 填写Bucket所在地域对应的Endpoint。以华东1(杭州)为例,Endpoint填写为https://oss-cn-hangzhou.aliyuncs.com。
    endpoint = 'https://oss-cn-hangzhou.aliyuncs.com'
    # 指定阿里云通用Region ID,例如cn-hangzhou。
    region = 'cn-hangzhou'

    # 指定Bucket名称,例如examplebucket。
    bucket = oss2.Bucket(auth, endpoint, 'examplebucket', region=region)

    # 指定原音频文件名称。
    source_key = 'src.mp3'

    # 指定转码后的音频文件。
    target_key = 'dest.aac'

    # 构建音频处理样式字符串以及音频转码处理参数。
    animation_style = 'audio/convert,ss_10000,t_60000,f_aac,ab_96000'

    # 构建处理指令,包括保存路径和Base64编码的Bucket名称和目标文件名称。
    bucket_name_encoded = base64.urlsafe_b64encode('examplebucket'.encode()).decode().rstrip('=')
    target_key_encoded = base64.urlsafe_b64encode(target_key.encode()).decode().rstrip('=')
    process = f"{animation_style}|sys/saveas,b_{bucket_name_encoded},o_{target_key_encoded}/notify,topic_QXVkaW9Db252ZXJ0"

    try:
        # 执行异步处理任务。
        result = bucket.async_process_object(source_key, process)
        print(f"EventId: {result.event_id}")
        print(f"RequestId: {result.request_id}")
        print(f"TaskId: {result.task_id}")
    except Exception as e:
        print(f"Error: {e}")


if __name__ == "__main__":
    main()

Go

要求使用Go SDK 3.0.2及以上版本。

package main

import (
	"encoding/base64"
	"fmt"
	"log"
	"os"

	"github.com/aliyun/aliyun-oss-go-sdk/oss"
)

func main() {
	// 从环境变量中获取临时访问凭证。运行本代码示例之前,请确保已设置环境变量OSS_ACCESS_KEY_ID、OSS_ACCESS_KEY_SECRET、OSS_SESSION_TOKEN。
	provider, err := oss.NewEnvironmentVariableCredentialsProvider()
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}
	// 创建OSSClient实例。
	// yourEndpoint填写Bucket对应的Endpoint,以华东1(杭州)为例,填写为https://oss-cn-hangzhou.aliyuncs.com。其他Region请按实际情况填写。
	// yourRegion指定阿里云通用Region ID,例如cn-hangzhou。
	client, err := oss.New("https://oss-cn-hangzhou.aliyuncs.com", "", "", oss.SetCredentialsProvider(&provider), oss.AuthVersion(oss.AuthV4), oss.Region("cn-hangzhou"))
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}
	// 指定Bucket名称,例如examplebucket。
	bucketName := "examplebucket"

	bucket, err := client.Bucket(bucketName)
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}

	// 指定原音频文件名称。
	sourceKey := "src.mp3"
	// 指定转码后的音频文件
	targetKey := "dest.aac"

	// 构建音频处理样式字符串以及音频转码处理参数。
	animationStyle := "audio/convert,ss_10000,t_60000,f_aac,ab_96000"

	// 构建处理指令,包括保存路径和Base64编码的Bucket名称和目标文件名称。
	bucketNameEncoded := base64.URLEncoding.EncodeToString([]byte(bucketName))
	targetKeyEncoded := base64.URLEncoding.EncodeToString([]byte(targetKey))
	process := fmt.Sprintf("%s|sys/saveas,b_%v,o_%v/notify,topic_QXVkaW9Db252ZXJ0", animationStyle, bucketNameEncoded, targetKeyEncoded)

	// 执行异步处理任务。
	result, err := bucket.AsyncProcessObject(sourceKey, process)
	if err != nil {
		log.Fatalf("Failed to async process object: %s", err)
	}

	fmt.Printf("EventId: %s\n", result.EventId)
	fmt.Printf("RequestId: %s\n", result.RequestId)
	fmt.Printf("TaskId: %s\n", result.TaskId)
}