全部产品
云市场

HBase数据备份和恢复

更新时间:2019-03-08 10:29:20

备份恢复基本介绍

备份恢复架构图

云HBase自研了支持HBase的备份恢复功能,上图为云HBase备份恢复基本的组成图,由全量数据备份/增量(实时)数据备份/全量数据恢复/增量数据恢复等几个大的模块组成,此外还有failover、流控等处理特性。云HBase的数据会通过备份系统把数据备份到OSS或者其他存储系统,现阶段默认备份到OSS(由于备份数据量大,会存在部分额外开销),整个备份恢复系统全自动化,用户只需要触发备份按钮即可,无需额外复杂操作。

注意:

备份恢复系统会把数据备份到OSS,备份数据量大的情况会存在部分额外开销。小于等于400G备份存储免费,超过会收取一定费用,具体费用可以咨询“云HBase答疑”。除与备份存储大小相关的正常定价之外,使用 云HBase 备份恢复不会产生任何额外费用。

备份操作步骤

备份包括全量数据备份(备份集备份)和增量数据备份(实时备份),这里图文介绍下,如何开启全量备份以及增量备份:首先用户购买完成一个集群以后在用户的控制台会看到如下图开通备份

左侧控制栏有备份与恢复,右侧是备份恢复的提示文字,这需要仔细阅读。 点击完成备份恢复立即开通按钮以后会出现备份恢复开启的提示页面,这个过程会需要涉及到重启集群的过程,所以建议在用户业务低峰期做这件事。当我们完成功能开启以后会有备份列表和备份设置两个选项,点击备份设置会出现。设置备份

这里设置的是全量备份(备份集备份)的属性,因为我们会周期性(默认一周)的把现有的全量数据备份到OSS,备份数据在OSS上面会默认保留10天;备份触发时间建议选择用户业务低峰期点,备份的时间点是一周中的某一天的某个时间点。

设置完成以后可以在备份列表看到全量备份的备份任务。对于增量备份是实时备份的,这里不会展示实际情况。

当上述操作完成以后,全量备份(备份集备份)也就设置完成了,设置的结果是,一周中的某一天的业务低峰期(用户设置)做全量备份(周期性),全量备份数据在OSS默认保留10天。开启完成全量备份以后会定时触发全量数据备份,同时会触发实时增量备份,将实时生成的增量数据备份到远端。

注意事项

1.用户可自定义选择备份时间点,建议选择的时间点为业务低峰期;

2.由于备份集备份过程中会涉及到备份系统给集群打快照,备份完成会做快照清理,那么备份过程中用户如果有使用到集群快照状态、信息等则会对用户使用带来影响。

3.备份集备份由于使用到了HBase打快照技术,且因为HBase会做compaction等操作,那么在快照删除前,会有一段较短时间让客户“误以为”,存储成本增加了。但是当备份完成以后该删除的数据还是会物理删除,不会引入额外存储成本。

4.开通备份恢复以后Hlog默认物理删除时间暂时会被调整到8小时删除,主要是为了增加数据Hlog被备份到远端安全性,后续我们会研发完善的Hlog可删除机制,这样不需要额外调整Hlog的配置项。

恢复操作步骤

当用户需要用到恢复功能的时候,可以按照如下操作进行执行。

恢复操作会将数据恢复到一个新建的集群(需要购买),然后把数据在新集群做恢复,老的集群用户可自行决定如何处理。整个恢复包括:备份集恢复以及时间点恢复。

当我们需要对某集群做恢复的时候,登录集群的控制台,在备份恢复页面的备份列表里面可以看到如下图:开始执行恢复

从这幅图里面可以做2种操作:时间点恢复,备份集恢复。所谓时间点恢复,就是用户可以选择恢复数据到可选的一个时间点(粒度是一小时),选择按时间点创建实列的话,会对应跳转到按时间点创建实列的页面:新集群购买

用户可以在备份时间点选项,选择对应的需要恢复的时间点。然后创建实列,后续我们的恢复操作会把数据恢复到对应时间点上。

所谓备份集恢复,我们可以在备份列表看到列表项的最后一列“操作”栏有“从备份点创建实列”这么一个选项。用户可以选择自己需要的备份集进行备份集恢复。这种恢复会将选择的这次备份集(全量备份)的数据恢复到新建的集群。

这里需要注意的一点是,恢复的集群,在创建的时候创建的集群容量不能小于源集群的容量(大于等于),否则会影响恢复流程的顺利进行。

在我们的创建恢复集群的页面也会给出源集群的相关信息,供用户选择新集群的规格和容量等信息。 如下图:

集群信息

当创建完成恢复集群以后,等待我们的备份数据做恢复即可完成整个恢复流程的操作。