Python转换文件存储类型

更新时间:2025-03-07 06:14:17

OSS 提供多种存储类型,包括标准、低频访问、归档、冷归档和深度冷归档,以满足从热数据到冷数据的各种存储需求。在对象存储中,一旦对象被创建,其内容是不可修改的。这意味着,如果您想更改对象的存储类型,就无法直接修改原对象,而必须创建一个新的对象。因此,本文介绍如何使用Python SDK V2中的CopyObject方法转换对象的存储类型,这一操作会通过复制原对象来实现存储类型的转换。

注意事项

  • 本文示例代码以华东1(杭州)的地域IDcn-hangzhou为例,默认使用外网Endpoint,如果您希望通过与OSS同地域的其他阿里云产品访问OSS,请使用内网Endpoint。关于OSS支持的RegionEndpoint的对应关系,请参见OSS地域和访问域名

  • 要转换文件存储类型,您必须具有oss:GetObjectoss:PutObjectoss:RestoreObject权限。具体操作,请参见RAM用户授权自定义的权限策略

示例代码

使用简单拷贝(CopyObject)转换文件类型

您可以使用简单拷贝CopyObject方法将标准存储类型的object转换成归档类型。

import argparse
import alibabacloud_oss_v2 as oss

# 创建命令行参数解析器
parser = argparse.ArgumentParser(description="copy object sample")

# 添加命令行参数 --region,表示存储空间所在的区域,必需参数
parser.add_argument('--region', help='The region in which the bucket is located.', required=True)
# 添加命令行参数 --bucket,表示目标存储空间的名称,必需参数
parser.add_argument('--bucket', help='The name of the destination bucket.', required=True)
# 添加命令行参数 --endpoint,表示其他服务可用来访问OSS的域名,非必需参数
parser.add_argument('--endpoint', help='The domain names that other services can use to access OSS')
# 添加命令行参数 --key,表示目标对象的名称,必需参数
parser.add_argument('--key', help='The name of the destination object.', required=True)
# 添加命令行参数 --source_key,表示源对象的名称,必需参数
parser.add_argument('--source_key', help='The name of the source object.', required=True)
# 添加命令行参数 --source_bucket,表示源存储空间的名称,必需参数
parser.add_argument('--source_bucket', help='The name of the source bucket.', required=True)

def main():
    # 解析命令行参数
    args = parser.parse_args()

    # 从环境变量中加载凭证信息,用于身份验证
    credentials_provider = oss.credentials.EnvironmentVariableCredentialsProvider()

    # 加载SDK的默认配置,并设置凭证提供者
    cfg = oss.config.load_default()
    cfg.credentials_provider = credentials_provider

    # 设置配置中的区域信息
    cfg.region = args.region

    # 如果提供了endpoint参数,则设置配置中的endpoint
    if args.endpoint is not None:
        cfg.endpoint = args.endpoint

    # 使用配置好的信息创建OSS客户端
    client = oss.Client(cfg)

    # 执行复制对象的请求
    result = client.copy_object(oss.CopyObjectRequest(
        bucket=args.bucket,  # 指定目标存储空间名称
        key=args.key,  # 指定目标对象键名
        source_key=args.source_key,  # 指定源对象键名
        source_bucket=args.source_bucket,  # 指定源存储空间名称
        storage_class= "Archive", # 转换存储类型为归档存储
    ))

    # 输出复制对象的结果信息
    print(f'status code: {result.status_code},'
          f' request id: {result.request_id},'
          f' version id: {result.version_id},'
          f' hash crc64: {result.hash_crc64},'
          f' source version id: {result.source_version_id},'
          f' server side encryption: {result.server_side_encryption},'
          f' server side data encryption: {result.server_side_data_encryption},'
          f' last modified: {result.last_modified},'
          f' etag: {result.etag},'
    )

# 当此脚本被直接运行时,调用main函数
if __name__ == "__main__":
    main()  # 脚本入口,当文件被直接运行时调用main函数

使用拷贝管理器(Copier)转换文件类型

您可以使用Python SDK V2新增的拷贝管理器中Copier.Copy方法进行文件类型转换,此方法组合了简单拷贝和分片拷贝接口,并且可根据拷贝的请求参数自动选择合适的接口去转换文件类型。

以下代码展示了如何使用Copier.Copy方法将标准存储类型的object转换成归档类型。

import argparse
import alibabacloud_oss_v2 as oss

# 创建命令行参数解析器
parser = argparse.ArgumentParser(description="copier sample")

# 添加命令行参数:region(必填),指定Bucket所在的地域
parser.add_argument('--region', help='The region in which the bucket is located.', required=True)

# 添加命令行参数:bucket(必填),指定目标Bucket名称
parser.add_argument('--bucket', help='The name of the bucket.', required=True)

# 添加命令行参数:endpoint(可选),指定OSS的访问域名
parser.add_argument('--endpoint', help='The domain names that other services can use to access OSS')

# 添加命令行参数:key(必填),指定目标对象的名称
parser.add_argument('--key', help='The name of the object.', required=True)

# 添加命令行参数:source_key(必填),指定源对象的名称
parser.add_argument('--source_key', help='The name of the source address for object.', required=True)

# 添加命令行参数:source_bucket(必填),指定源Bucket的名称
parser.add_argument('--source_bucket', help='The name of the source address for bucket.', required=True)


def main():
    # 解析命令行参数
    args = parser.parse_args()

    # 从环境变量中加载凭证信息
    # 使用EnvironmentVariableCredentialsProvider从环境变量中读取Access Key ID和Access Key Secret
    credentials_provider = oss.credentials.EnvironmentVariableCredentialsProvider()

    # 使用SDK的默认配置
    cfg = oss.config.load_default()
    cfg.credentials_provider = credentials_provider  # 设置凭证提供者
    cfg.region = args.region  # 设置Bucket所在的地域
    if args.endpoint is not None:
        cfg.endpoint = args.endpoint  # 如果提供了endpoint,则设置自定义访问域名

    # 创建OSS客户端实例
    client = oss.Client(cfg)

    # 创建Copier实例并执行对象复制操作
    copier = client.copier()

    # 执行对象复制操作
    result = copier.copy(
        oss.CopyObjectRequest(
            bucket=args.bucket,          # 目标Bucket名称
            key=args.key,                # 目标对象名称
            source_bucket=args.source_bucket,  # 源Bucket名称
            source_key=args.source_key,  # 源对象名称
            storage_class="Archive", # 转换存储类型为归档存储
        )
    )

    # 打印复制结果
    # 使用vars(result)将结果对象转换为字典格式并打印
    print(vars(result))


if __name__ == "__main__":
    main()
  • 本页导读 (1)
  • 注意事项
  • 示例代码
  • 使用简单拷贝(CopyObject)转换文件类型
  • 使用拷贝管理器(Copier)转换文件类型