本文为您介绍如何通过公网环境将谷歌云GCP(Google Cloud Platform)的BigQuery数据集迁移至阿里云MaxCompute。
前提条件
类别 | 平台 | 要求 | 参考文档 |
---|---|---|---|
环境及数据 | 谷歌云GCP |
|
如果您没有相关环境及数据集,可参考如下内容准备:
|
阿里云 |
|
如果您没有相关环境,可参考如下内容准备:
|
|
账号 | 谷歌云GCP | 已创建具备访问谷歌Cloud Storage权限的IAM用户。 | 通过JSON使用IAM权限 |
阿里云 | 已创建具备存储空间读写权限和在线迁移权限的RAM用户及RAM角色。 | 创建RAM用户和STS模式授权 | |
区域 | 谷歌云GCP | 无。 | 无 |
阿里云 | 开通OSS服务的区域与MaxCompute项目在同一区域。 | 无 |
背景信息
将BigQuery数据集迁移至阿里云MaxCompute的流程如下。

序号 | 描述 |
---|---|
① | 将BigQuery数据集导出至谷歌Cloud Storage。 |
② | 通过对象存储服务OSS的在线迁移上云服务,将数据从谷歌Cloud Storage迁移至OSS。 |
③ | 将数据从OSS迁移至同区域的MaxCompute项目中,并校验数据完整性和正确性。 |
步骤一:将BigQuery数据集导出至谷歌Cloud Storage
您可以使用bq命令行工具执行bq extract
命令,将BigQuery数据集导出至谷歌Cloud Storage。
步骤二:将导出至谷歌Cloud Storage的数据迁移至对象存储服务OSS
对象存储服务OSS支持通过在线迁移上云服务,将谷歌Cloud Storage的数据迁移至OSS,详情请参见谷歌云GCP迁移教程。在线迁移上云服务处于公测状态,您需要联系客服,并由在线服务团队开通后才可使用。
步骤三:将数据从OSS迁移至同区域的MaxCompute项目
您可以通过MaxCompute的LOAD命令将OSS数据迁移至同区域的MaxCompute项目中。
LOAD命令支持STS认证和AccessKey认证两种方式,AccessKey认证方式需要使用明文AccessKey ID和AccessKey Secret。STS认证方式不会暴露AccessKey信息,具备高安全性。本文以STS认证方式为例介绍数据迁移操作。