Hive数据迁移至MaxCompute

本文档主要介绍结合CMH与MMA如何完成数据从Hive到MaxCompute的数据迁移流程。

整体步骤

迁移过程

Hive资源对象发现

通过部署CMH的调研工具hive-scanner,进行Hive迁移对象的探索及资源导入,详见Hive 资源发现

集群构建

您可以在云迁移中心(CMH)的资源列表中勾选多个资源完成集群的创建,详见集群创建

迁移规划

基于MMA资产盘点的对象进行同步任务的批次规划,并完成迁移任务的批次跟踪,参考下图MMA资产管理新建批次功能。

MMA新建同步

启动迁移

基于MMA的新建批次工具完成迁移任务提交,正式发起Hive到MaxCompute数据的同步,参考下图MMA任务管理,进行迁移任务的状态跟踪。

迁移任务

进展跟踪

基于CMH的集群列表可以整体看到数据迁移任务及其他组件迁移的整体进度,详见项目大盘