将Hive数据迁移并增量同步至MaxCompute-搬站上云-阿里云

场景概述

本案例通过Hive udtf 的方式将Hive数据表迁移到MaxCompute，包括将Hive表结构迁移到MaxCompute、存量数据迁移到MaxCompute，迁移过程中需要开启增量，定期发现新的Hive数据，并及时同步到MaxCompute。

通过本文，您可以：

基础信息	配置项	描述	UI展示
	迁移任务名称
	组件映射	选择待迁移的数据源信息
	数据库选择	选择完组件映射后，需要选择组件数据源对应的数据库（这里数据库就是待迁移的数据库）
	描述	任务描述信息
迁移任务设置	迁移类型	仅迁移结构结构迁移+存量数据迁移结构迁移+存量数据迁移+增量数据同步
	迁移方式	Tunnel模式 Hadoop inside湖仓一体 OSS中转方案
	增量控制开关	选择增量数据同步迁移类型时，会有增量控制开关功能。开启时，可控制存量实例未跑完时，不触发增量实例
	迁移数据对象选择	白名单模式黑名单模式
	任务时间设置	选择增量数据同步迁移类型时，需要设置后续数据迁移执行时间
	重试时长和频率	暂未开放
	同步并发数	暂未开放
	全局参数配置	该配置项主要是LHM系统的全局参数 ●hive.task.partition.max.num=50 # 单个任务处理的最多分区数量 ●hive.task.partition.max.size=5 # 单个任务处理的最大数量(单位G)
	自定义参数配置	该配置项目主要是设置hadoop环境的执行参数