视频转码

更新时间:
复制为 MD 格式

当您需要修改视频编码格式、降低分辨率和码率、转换封装格式、调整视频参数以适应不同需求,可以使用视频转码功能。

功能简介

视频转码通过将已压缩编码的视频码流转换为另一种视频码流,将视频格式、封装、分辨率、帧率及码率等参数转换为适合不同设备和平台播放,同时降低文件大小以优化传输效率的过程。

image

使用场景

  • 多设备兼容性:为确保视频能够在不同设备(如手机、平板、电脑、智能电视等)上顺利播放,转码技术能够将视频转换为符合特定设备所支持的格式。

  • 流媒体播放:流媒体服务需要将视频转码为多种格式和比特率,以便根据用户的网络状况进行动态调整,从而提升观看体验。

  • 视频压缩:在确保视频质量的前提下,通过转码技术降低文件大小,以便于存储和传输,尤其是在网络带宽受限的情况下。

如何使用

前提条件

  • 开通智能媒体管理(IMM)服务

  • OSS创建存储空间(Bucket),上传需要处理的文件Bucket中。

  • 已创建并绑定 IMM Project,您可以通过OSS控制台绑定或调用API绑定,IMM Project需要跟Bucket在同一地域下。

  • 授权用户对应操作的权限。若您使用阿里云账号,则默认拥有全部权限,无需进行授权操作;若您使用阿里云账号下的RAM用户或RAM角色,默认没有任何权限,需要阿里云账号或账号管理员通过RAM PolicyBucket Policy授予操作权限。

    权限说明

    • 授予用户访问关联资源的权限。

      • 授予用户使用OSS进行数据处理的权限。

        API

        Action

        说明

        GetObject

        oss:GetObject

        下载Object。

        oss:GetObjectVersion

        下载Object时,如果通过versionId指定了Object的版本,则需要授予此操作的权限。

        kms:Decrypt

        下载Object时,如果Object的元数据包含X-Oss-Server-Side-Encryption: KMS,则需要此操作的权限。

        oss:ProcessImm

        通过OSS使用IMM进行数据处理的权限。

        PostProcessTask

        oss:PostProcessTask

        通过POST请求使用数据处理功能的权限,例如异步处理(x-oss-async-process)。

      • 授予用户使用 IMM 的媒体转码功能的权限。

        API

        Action

        说明

        CreateMediaConvertTask

        imm:CreateMediaConvertTask

        使用IMM进行媒体转码的权限。

    • 授予IMM服务使用的角色(默认为AliyunIMMDefaultRole,其资源ARNacs:ram:*:<account-id>:role/aliyunimmdefaultrole)访问关联资源进行数据处理的权限。

      API

      Action

      说明

      ram:PassRole

      执行跨服务资源操作。

      GetObject

      oss:GetObject

      下载Object。

      oss:GetObjectVersion

      下载Object时,如果通过versionId指定了Object的版本,则需要授予此操作的权限。

      kms:Decrypt

      下载Object时,如果Object的元数据包含X-Oss-Server-Side-Encryption: KMS,则需要此操作的权限。

      HeadObject

      oss:GetObject

      获取某个Object的元数据。

      PutObject

      oss:PutObject

      上传Object。

      oss:PutObjectVersion

      上传Object 时,如果通过versionId指定了Object的版本,则需要授予此操作的权限。

      kms:GenerateDataKey

      上传Object时,如果Object的元数据包含X-Oss-Server-Side-Encryption: KMS,则需要这两个操作的权限。

      kms:Decrypt

视频转码

仅支持使用Java、Python、Go SDK通过异步处理的方式完成视频转码。

Java

要求使用3.17.4及以上版本的Java SDK。

import com.aliyun.oss.ClientBuilderConfiguration;
import com.aliyun.oss.OSS;
import com.aliyun.oss.OSSClientBuilder;
import com.aliyun.oss.common.auth.CredentialsProviderFactory;
import com.aliyun.oss.common.auth.EnvironmentVariableCredentialsProvider;
import com.aliyun.oss.common.comm.SignVersion;
import com.aliyun.oss.model.AsyncProcessObjectRequest;
import com.aliyun.oss.model.AsyncProcessObjectResult;
import com.aliyuncs.exceptions.ClientException;

import java.util.Base64;

public class Demo {
    public static void main(String[] args) throws ClientException {
        // yourEndpoint填写Bucket所在地域对应的Endpoint。
        String endpoint = "https://oss-cn-hangzhou.aliyuncs.com";
        // 指定阿里云通用Region ID,例如cn-hangzhou。
        String region = "cn-hangzhou";
        // 从环境变量中获取访问凭证。运行本代码示例之前,请确保已设置环境变量OSS_ACCESS_KEY_ID和OSS_ACCESS_KEY_SECRET。
        EnvironmentVariableCredentialsProvider credentialsProvider = CredentialsProviderFactory.newEnvironmentVariableCredentialsProvider();
        // 指定Bucket名称,例如examplebucket。
        String bucketName = "examplebucket";
        // 指定处理后视频文件名称。
        String targetKey = "dest.avi";
        // 指定原视频文件名称。
        String sourceKey = "src.mp4";

        // 创建OSSClient实例。
        // 当OSSClient实例不再使用时,调用shutdown方法以释放资源。
        ClientBuilderConfiguration clientBuilderConfiguration = new ClientBuilderConfiguration();
        clientBuilderConfiguration.setSignatureVersion(SignVersion.V4);
        OSS ossClient = OSSClientBuilder.create()
                .endpoint(endpoint)
                .credentialsProvider(credentialsProvider)
                .clientConfiguration(clientBuilderConfiguration)
                .region(region)
                .build();

        try {
            // 构建视频处理样式字符串以及视频转码处理参数。
            String style = String.format("video/convert,f_avi,vcodec_h265,s_1920x1080,vb_2000000,fps_30,acodec_aac,ab_100000,sn_1");
            // 构建异步处理指令。
            String bucketEncoded = Base64.getUrlEncoder().withoutPadding().encodeToString(bucketName.getBytes());
            String targetEncoded = Base64.getUrlEncoder().withoutPadding().encodeToString(targetKey.getBytes());
            String process = String.format("%s|sys/saveas,b_%s,o_%s", style, bucketEncoded, targetEncoded);
            // 创建AsyncProcessObjectRequest对象。
            AsyncProcessObjectRequest request = new AsyncProcessObjectRequest(bucketName, sourceKey, process);
            // 执行异步处理任务。
            AsyncProcessObjectResult response = ossClient.asyncProcessObject(request);
            System.out.println("EventId: " + response.getEventId());
            System.out.println("RequestId: " + response.getRequestId());
            System.out.println("TaskId: " + response.getTaskId());

        } finally {
            // 关闭OSSClient。
            ossClient.shutdown();
        }
    }
}

Python

要求使用Python SDK 2.18.4及以上版本。

# -*- coding: utf-8 -*-
import base64
import oss2
from oss2.credentials import EnvironmentVariableCredentialsProvider


def main():
    # 填写Bucket所在地域对应的Endpoint。以华东1(杭州)为例,Endpoint填写为https://oss-cn-hangzhou.aliyuncs.com。
    endpoint = 'https://oss-cn-hangzhou.aliyuncs.com'
    # 从环境变量中获取访问凭证。运行本代码示例之前,请确保已设置环境变量OSS_ACCESS_KEY_ID和OSS_ACCESS_KEY_SECRET。
    auth = oss2.ProviderAuthV4(EnvironmentVariableCredentialsProvider())

    # 填写Bucket名称。
    bucket_name = 'examplebucket'
    # 填写阿里云通用Region ID,例如cn-hangzhou。
    region = 'cn-hangzhou'
    # 创建Bucket实例。
    bucket = oss2.Bucket(auth, endpoint, bucket_name, region=region)

    # 指定原视频文件名称。
    source_key = 'src.mp4'
    # 指定处理后视频文件名称。
    target_key = 'dest.avi'
    # 构建视频处理样式字符串以及视频转码处理参数。
    style = 'video/convert,f_avi,vcodec_h265,s_1920x1080,vb_2000000,fps_30,acodec_aac,ab_100000,sn_1'
    process = "{0}|sys/saveas,o_{1}".format(style,
                                            oss2.compat.to_string(base64.urlsafe_b64encode(
                                                oss2.compat.to_bytes(target_key))).replace('=', ''))

    # 调用异步流媒体处理接口。
    try:
        # 执行异步处理任务。
        result = bucket.async_process_object(source_key, process)
        print(f"EventId: {result.event_id}")
        print(f"RequestId: {result.request_id}")
        print(f"TaskId: {result.task_id}")
    except Exception as e:
        print(f"Error: {e}")


if __name__ == "__main__":
    main()

Go

要求使用Go SDK 3.0.2及以上版本。

package main

import (
	"encoding/base64"
	"fmt"
	"os"
	"strings"

	"github.com/aliyun/aliyun-oss-go-sdk/oss"
)

func main() {
	// 从环境变量中获取访问凭证。运行本代码示例之前,请确保已设置环境变量OSS_ACCESS_KEY_ID和OSS_ACCESS_KEY_SECRET。
	provider, err := oss.NewEnvironmentVariableCredentialsProvider()
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}
	// 创建OSSClient实例。
	// yourEndpoint填写Bucket对应的Endpoint,以华东1(杭州)为例,填写为https://oss-cn-hangzhou.aliyuncs.com。其它Region请按实际情况填写。
	client, err := oss.New("https://oss-cn-hangzhou.aliyuncs.com", "", "", oss.SetCredentialsProvider(&provider), oss.AuthVersion(oss.AuthV4), oss.Region("cn-hangzhou"))
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}
	// 指定视频所在的Bucket名称,例如examplebucket。
	bucketName := "examplebucket"
	bucket, err := client.Bucket(bucketName)
	// 指定处理后视频文件名称。
	targetObject := "dest.avi"
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}
	// 指定原视频文件名称。
	sourceObject := "src.mp4"

	// 构建视频处理样式字符串以及视频转码处理参数。
	style := "video/convert,f_avi,vcodec_h265,s_1920x1080,vb_2000000,fps_30,acodec_aac,ab_100000,sn_1"

	process := fmt.Sprintf("%s|sys/saveas,b_%v,o_%v", style, strings.TrimRight(base64.URLEncoding.EncodeToString([]byte(bucketName)), "="), strings.TrimRight(base64.URLEncoding.EncodeToString([]byte(targetObject)), "="))
	fmt.Printf("%#v\n", process)
	rs, err := bucket.AsyncProcessObject(sourceObject, process)
	if err != nil {
		fmt.Println("Error:", err)
		os.Exit(-1)
	}
	fmt.Printf("EventId:%s\n", rs.EventId)
	fmt.Printf("RequestId:%s\n", rs.RequestId)
	fmt.Printf("TaskId:%s\n", rs.TaskId)
}

参数说明

操作名称:video/convert

具体参数如下表所示。

参数

类型

是否必选

描述

ss

int

起始时间,单位为毫秒。取值:

  • 0(默认值):从起始位置开始。

  • 大于0:从第ss毫秒开始。

t

int

转码时长,单位为毫秒。取值:

  • 0(默认值):持续到结束位置。

  • 大于0:持续t毫秒。

f

string

媒体容器类型。取值:

  • 音视频容器:mp4、mkv、mov、asf、avi、mxf、ts、flv、webm

  • 音频容器:mp3、aac、flac、oga、ac3、opus、amr

vn

int

是否禁用视频流。取值:

  • 0(默认值):不禁用。

  • 1:禁用,输出文件中将不包含视频流。

vcodec

string

视频codec(编码格式)。取值:

  • copy(默认值):将需要处理的视频流直接拷贝到输出文件。

  • h264:h264编码格式。

  • h265:h265编码格式。

  • vp9:vp9编码格式。

fps

float

视频帧率。取值范围:0~240。

fpsopt

int

视频帧率选项。取值:

  • 0:始终使用目标帧率。

  • 1:源视频帧率小于fps时使用源视频帧率。

  • 2:源视频帧率小于fps时返回失败。

pixfmt

string

像素采样格式,默认与源视频一致。取值:

  • yuv420p

  • yuva420p

  • yuv420p10le

  • yuv422p

  • yuv422p10le

  • yuv444p

  • yuv444p10le

s

string

目标分辨率。

  • 格式为w x h,即宽 x 高。

  • 宽和高的取值应为2的倍数,且取值范围为64~4096。例如:4096x4096、64x64等。

sopt

int

分辨率选项。取值:

  • 0:始终使用目标分辨率。

  • 1:源视频分辨率小于s时使用源视频分辨率。

  • 2:源视频分辨率小于s时返回失败。

scaletype

string

缩放方式。取值:

  • crop:等比缩放,缩放为延伸出指定宽高或长短边的矩形框外的最小分辨率,然后将超出的部分进行居中裁剪。

  • stretch(默认值):固定宽高或长短边,强制缩放,拉伸以填满空白部分。

  • fill:等比缩放,缩放为指定宽高或长短边的矩形内的最大分辨率,然后使用黑色居中填充空白部分。

  • fit:等比缩放,缩放为指定宽高或长短边的矩形内的最大分辨率。

arotate

int

长短边自适应。取值:

  • 0(默认值):关闭。

  • 1:打开。

g

int

关键帧。取值范围:1~100000。

vb

int

视频比特率(码率),单位为比特/秒(bps)。取值范围:10000~100000000。

vbopt

int

视频码率选项。取值:

  • 0:始终使用目标视频码率。

  • 1:源视频码率小于vb时使用源视频码率。

  • 2:源视频码率小于vb时返回失败。

videoslim

int

轻码高清模式。取值:

0:默认值,表示关闭。

1:表示使用轻码高清模式转码。

说明

为获得最佳效果,轻码高清推荐使用官方推荐BitrateCRF参数进行视频转码。

重要

轻码高清仅支持h.264/h.265格式,仅支持yuv420p像素采样格式,仅支持8bit位深。

更多说明请参见轻码高清

crf

float

码率控制因子。取值范围:0~51。

maxrate

int

峰值码率,单位为比特/秒(bps)。取值范围:10000~100000000。

bufsize

int

缓冲区大小,单位为比特(bits)。取值范围:10000~200000000。

an

int

是否禁用音频流。取值:

  • 0(默认值):不禁用。

  • 1:禁用,输出文件中将不包含音频流。

acodec

string

音频codec(编码格式)。取值:

  • copy(默认值):将需要处理的音频流直接拷贝到输出文件。

  • mp3:mp3编码格式。

  • aac:aac编码格式。

  • flac:flac编码格式。

  • vorbis:vorbis编码格式。

  • ac3:ac3编码格式。

  • opus:opus编码格式。

  • amr:amr编码格式。

ar

int

音频采样率。取值:

  • 8000

  • 11025

  • 12000

  • 16000

  • 22050

  • 24000

  • 32000

  • 44100

  • 48000

  • 88200

  • 96000

ac

int

音频声道数。默认保持源音频的声道数。取值范围:1~8。

aq

int

音频压缩质量。与参数ab互斥。取值范围:0~100。

ab

int

音频比特率(码率)。与参数aq互斥,单位为比特/秒(bps)。取值范围:1000~10000000。

abopt

int

音频码率选项。取值:

  • 0(默认值):始终使用目标音频码率。

  • 1:源音频码率小于ab时使用源音频码率。

  • 2:源音频码率小于ab时返回失败。

sn

int

是否禁用字幕。取值:

  • 0(默认值):不禁用。

  • 1:禁用,输出文件中将不包含字幕。

adepth

int

音频采样位深,取值为1624。

说明

该参数仅在acodecflac时有效

segment

string

媒体切片设置,默认不进行切片。

f

string

媒体切片方式。取值:

  • hls

  • dash

父节点:segment

t

int

切片长度,单位为毫秒。取值范围:0~3600000。

父节点:segment

视频转码时也会用到sys/saveasnotify参数。更多信息,请参见另存为消息通知

相关API

以上操作方式底层基于API实现,如果您的程序自定义要求较高,您可以直接发起REST API请求。直接发起REST API请求需要手动编写代码计算签名。关于公共请求头Authorization的计算方法,请参见签名版本4(推荐)

AVI格式转换为MP4格式

转码信息

  • 转码前

    • 视频格式:AVI

    • 视频名称:example.avi

  • 处理方式:视频转码

  • 转码后

    • 视频信息

      • 视频格式:MP4

      • 视频名称:outobjprefix.mp4

      • 视频流格式:H.265

      • 视频分辨率:1920x1080

      • 视频帧率:30 fps

      • 视频码率:2 Mbps

    • 音频信息

      • 音频流格式:AAC

      • 音频码率:100 Kbps

      • 字幕流:禁用

    • 文件存储路径:oss://outbucket/outobjprefix.mp4

处理示例

POST /example.avi?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: SignatureValue
 
// 对文件example.avi进行视频转码,转码输出媒体文件容器为MP4,视频流格式为H.265,分辨率为1920x1080,帧率为30 fps,视频码率为2 Mbps;音频流格式为AAC,音频码率为100 Kbps;禁用字幕流;转码完成后将得到的文件保存为oss://outbucket/outobjprefix.mp4。
x-oss-async-process=video/convert,f_mp4,vcodec_h265,s_1920x1080,vb_2000000,fps_30,acodec_aac,ab_100000,sn_1|sys/saveas,b_b3V0YnVja2V0,o_b3V0b2JqcHJlZml4LnthdXRvZXh0fQ

AVI格式转换为TS格式

转码信息

  • 转码前

    • 视频格式:AVI

    • 视频名称:example.avi

  • 处理方式

    • 转码时长:从输入媒体文件的第1000毫秒开始并持续60000毫秒进行视频转码

    • 切片方式:按30秒间隔进行HLS切片

    • 转码完成消息通知:发送MNS消息

  • 转码后

    • 视频信息

      • 视频格式:TS

      • 视频流格式:H.264

      • 视频码率:1 Mbps

    • 音频信息

      • 音频格式:AAC

      • 音频码率:100 Kbps

    • 文件存储路径

      • ts文件:oss://outbucket/outobjprefix-%d.ts

      • m3u8文件:oss://outbucket/outobjprefix.m3u8

处理示例

POST /example.avi?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: SignatureValue
 
// 对文件example.avi进行视频转码。
x-oss-async-process=video/convert,ss_10000,t_60000,f_ts,vcodec_h264,vb_1000000,acodec_mp3,ab_100000/segment,f_hls,t_30000|sys/saveas,b_b3V0YnVja2V0,o_b3V0b2JqcHJlZml4LnthdXRvZXh0fQ/notify,topic_QXVkaW9Db252ZXJ0

AVI格式转换为MP3格式

转码信息

  • 转码前

    • 视频名称:example.avi

    • 视频格式:AVI

  • 处理方式:提取音频并将提取的音频进行转码

  • 转码后

    • 音频容器:MP3

    • 音频编码格式:MP3

    • 音频码率:100 Kbps

    • 视频流:禁用

    • 字幕流:禁用

    • 文件存储路径:音频文件存储路径为oss://outbucket/outobjprefix.mp3,如果视频有多路音频,默认只处理第一路音频。

处理示例

POST /example.avi?x-oss-async-process HTTP/1.1
Host: video-demo.oss-cn-hangzhou.aliyuncs.com
Date: Fri, 28 Oct 2022 06:40:10 GMT
Authorization: SignatureValue
 
// 对文件example.avi进行音频提取并将提取的音频进行转码。
x-oss-async-process=video/convert,f_mp3,acodec_mp3,ab_100000,vn_1,sn_1|sys/saveas,b_b3V0YnVja2V0,o_b3V0b2JqcHJlZml4LnthdXRvZXh0fQ

计费说明

在视频转码过程中,由于调用了 IMM 服务, OSS 和 IMM 两侧会产生以下计费项:

  • OSS 侧: 详细定价请参见OSS产品定价

    API

    计费项

    说明

    GetObject

    GET 类型请求

    根据成功的请求次数计算请求费用。

    外网流出流量费用

    如果是通过外网Endpoint(示例值oss-cn-hangzhou.aliyuncs.com)或者传输加速Endpoint(示例值oss-accelerate.aliyuncs.com)调用GetObject接口时,会产生外网流出流量费用,根据数据容量大小计费。

    低频访问数据取回容量

    如果取回的数据是低频访问数据,会产生低频访问数据取回容量的费用,按数据取回量计费。

    归档直读数据取回容量

    如果读取的是归档的ObjectBucket开启了归档直读,会产生归档直读数据取回容量费用,根据取回的数据容量大小计费。

    传输加速

    如果开启了传输加速功能且使用传输加速域名访问您的Bucket会产生传输加速费用,根据数据容量大小计费。

    PutObject

    PUT类型请求

    根据成功的请求次数计算请求费用。

    存储费用

    根据Object的存储类型、大小和时长收取存储费用。

    HeadObject

    GET 类型请求

    根据成功的请求次数计算请求费用。

  • IMM 侧: 详细定价请参见IMM计费项

    API

    计费项

    说明

    CreateMediaConvertTask

    VideoCompress264LD

    转码264-LD产生的费用,根据视频实际时长计算媒体处理费用(以秒为单位)。

    VideoCompress264SD

    转码264-SD产生的费用,根据视频实际时长计算媒体处理费用(以秒为单位)。

    VideoCompress264HD

    转码264-HD产生的费用,根据视频实际时长计算媒体处理费用(以秒为单位)。

    VideoCompress2642K

    转码264-2K产生的费用,根据视频实际时长计算媒体处理费用(以秒为单位)。

    VideoCompress2644K

    转码264-4K产生的费用,根据视频实际时长计算媒体处理费用(以秒为单位)。

    VideoCompress265LD

    转码265-LD产生的费用,根据视频实际时长计算媒体处理费用(以秒为单位)。

    VideoCompress265SD

    转码265-SD产生的费用,根据视频实际时长计算媒体处理费用(以秒为单位)。

    VideoCompress265HD

    转码265-HD产生的费用,根据视频实际时长计算媒体处理费用(以秒为单位)。

    VideoCompress2652K

    转码265-2K产生的费用,根据视频实际时长计算媒体处理费用(以秒为单位)。

    VideoCompress2654K

    转码265-4K产生的费用,根据视频实际时长计算媒体处理费用(以秒为单位)。

    AudioCompress

    转码音频产生的费用。

注意事项

  • 视频转码仅支持异步处理(x-oss-async-process处理方式)。

  • 不支持匿名访问。

  • 支持MP4、MPEG-TS、MKV、MOV、AVI、FLV、M3U8、WebM、WMV、RM、VOB等多种视频格式。

常见问题

视频转码时提示无法找到资源怎么办?

视频转码时出现报错信息“ResourceNotFound, The specified resource Attachment is not found.”错误,可能是未绑定Bucket。请在创建IMM项目后绑定Bucket。具体操作请参见oss数据处理使用指南

视频转码时能否转存到原路径?

不可以,视频转码时输出路径应避免以输入路径为前缀,否则将导致触发器循环触发和源文件被覆盖等非预期行为。

视频转码是否支持设置音频位深?

视频转码支持位深设置,通过OSS x-oss-process方式的pixfmt参数来进行设置。

视频转码如何通过返回的taskid获取task执行结果?

建议参考智能媒体管理的GetTask - 获取任务信息来获取。

视频转码时OSS如何根据后缀检索删除特定格式文件?

OSS不支持通过后缀搜索文件,因为OSS是无序存储。

视频转码已配置消息队列推送,但后端未能接收到消息?

确认主题及订阅是否已创建。如不存在或被删除,则需重新配置订阅。根据当前配置的订阅,重新发起转码处理。

将视频上传至OSS后,可以使用指定的模板进行转码吗?

配置相应的触发器即可实现相关功能。视频处理的相关数据处理能力可以由用户主动提交,也可以通过配置批处理和触发器来自动触发对存储桶中存量和增量视频的处理。任务、批处理和触发器可以采用系统样式或自定义样式,具体请参见批处理触发器

转码后的视频是否会产生收费?

转码后的视频将占用存储空间,产生计费。

转码输出的文件路径是否可与源路径一致,会不会导致文件被替换?

不建议将输出路径与源文件路径设置为一致,否则会覆盖源文件。