本最佳实践介绍如何将客户自建Hadoop/Hive数据仓库迁移到阿里云EMR的技术实现方案和实践步骤。

直达最佳实践

点击查看最佳实践详情

更多最佳实践

点击查看更多阿里云最佳实践

场景描述

客户在IDC或者公有云环境自建Hadoop集群构建数据仓库和分析系统,购买阿里云EMR集群之后,涉及到将数据仓库和Hive元数据的数据库迁移上云。目前主流Hive数据仓库迁移场景为1.x版本迁移到阿里云EMR(Hive 2.x版本),涉及到数据订正更新步骤。

解决的问题

  • Hive数据仓库的数据迁移方案。
  • Hive元数据库的迁移方案。
  • Hive跨版本迁移后的数据订正。

部署架构图

EMR部署架构图