介绍如何将客户自建Hadoop/Hive数据仓库迁移到阿里云EMR的技术实现方案和实践步骤。

直达最佳实践

点击查看最佳实践详情

更多最佳实践

点击查看更多阿里云最佳实践

场景描述

场景1:自建Hadoop集群数据(HDFS)迁移到阿里云EMR集群的HDFS文件系统。

场景2:自建Hadoop集群数据(HDFS)迁移到计算存储分离架构的阿里云EMR集群,以OSS和JindoFS作为EMR集群的后端存储。

解决的问题

  • 客户自建Hadoop迁移到阿里云EMR集群的技术方案。
  • 基于IPSec VPN隧道构建安全和低成本数据传输链路。

部署架构图

自建Hadoop数据迁移到阿里云EMR架构图