本最佳实践介绍如何将客户自建Hadoop/Hive数据仓库迁移到阿里云EMR的技术实现方案和实践步骤。
直达最佳实践
更多最佳实践
场景描述
客户在IDC或者公有云环境自建Hadoop集群构建数据仓库和分析系统,购买阿里云EMR集群之后,涉及到将数据仓库和Hive元数据的数据库迁移上云。目前主流Hive数据仓库迁移场景为1.x版本迁移到阿里云EMR(Hive 2.x版本),涉及到数据订正更新步骤。
解决的问题
- Hive数据仓库的数据迁移方案。
- Hive元数据库的迁移方案。
- Hive跨版本迁移后的数据订正。