HBase数据同步或迁移到Lindorm_云原生多模数据库 Lindorm(Lindorm)-阿里云帮助中心

如果您想要将自建HBase或阿里云HBase中的数据迁移或同步至Lindorm宽表引擎，可以通过LTS服务完成存量数据迁移和实时数据同步。本文介绍HBase数据同步与迁移的使用场景、功能列表、迁移优势、使用限制以及迁移任务等操作。

使用场景

迁移前请确认目标集群的HDFS容量，防止迁移过程中出现容量写满的情况。
增量同步提交前，建议将源集群的日志保留时间调大至12小时以上，给增量同步出错预留一些处理的时间。修改方式：修改hbase-site.xml文件中hbase.master.logcleaner.ttl参数的值，并在修改后重启HMaster。hbase.master.logcleaner.ttl参数的单位为毫秒（ms），设置时需注意单位转化，例如，hbase.master.logcleaner.ttl=43200000表示设置日志保留时间为12小时。
客户无需在目标集群创建表，LTS同步服务会自动创建和源集群一样的表，包括分区的信息。客户自建的目标表可能会和源表分区很不一致，这可能会导致迁移完成之后，目标表会进行频繁的split、compaction，如果表的数据量十分庞大，可能会导致这个过程非常耗时。
如果源表带有coprocessor，在创建目标表的时候需要确保目标集群包含coprocessor对应的JAR包。
开启增量同步后，如果不消费数据，默认日志会保留48小时，超时后订阅关系自动取消，保留的数据自动删除。

登录LTS。具体操作，请参见登录LTS。
在左侧导航栏，选择Lindorm/HBase迁移 > 一键迁移。
单击创建任务。
在任务名（可不填）文本框中，填写任务名称。任务名只支持英文字符、数字。非必填项，未填写情况下默认任务ID为任务名。
根据界面提示，设置源集群和目标集群。
勾选需要的操作。
- 表结构迁移：在目标集群创建表（Schema、分区信息一致），目标集群表已存在会跳过。
- 实时数据复制：同步源集群实时增量的数据。
- 历史数据迁移：文件级别的全量文件物理迁移。
填写同步/迁移的表和高级配置，高级配置为非必填项。
单击创建。

Q：什么场景会导致“不消费数据”？

A：没有终止任务的前提下直接释放LTS集群；同步任务暂停；任务异常阻塞。