跨可用区(AZ)容灾,即在同Region不同可用区部署同构的Hologres容灾实例,如果生产实例所处的地理位置发生自然灾害,或者实例内部出现了故障导致生产实例无法正常对外提供读写服务,那么容灾实例可以切换为生产实例,从而保障业务连续性。本文为您介绍如何在Hologres配置跨可用区容灾。
架构介绍
Hologres跨可用区容灾部署架构图如下:
当同Region(杭州Region)可用区(可用区I)中的Hologres实例无法正常运行时,可通过已配置的容灾关系,将其他可用区(可用区J)的Hologres实例切换为生产实例,保障业务正常运行。
使用限制
仅支持Hologres V2.2.28及以上版本的通用型实例配置跨可用区容灾,若您的实例版本低于V2.2.28,可联系Hologres技术支持升级实例。
只读从实例不支持作为容灾实例。
生产实例和容灾实例类型、版本必须一致。
若生产实例已开启Serverless Computing,则不支持配置容灾。
生产实例和容灾实例必须处于同一地域的不同可用区。例如生产实例在华东1(杭州)可用区H,容灾实例在华东1(杭州)可用区J。
生产实例和容灾实例必须处于同一个专有网络(VPC)。
注意事项
容灾实例不支持备份恢复。
生产实例和容灾实例需要一起升级。
不可以单独停止生产实例或容灾实例。
生产实例会向容灾实例同步数据,容灾实例的原有数据将被清除。
容灾实例切换为主实例后,原本绑定在生产实例上的只读从实例会进入停机状态,待生产实例恢复使用后方可启用。
当前仅支持容灾强制切换,即无论生产和容灾实例之间数据同步是否有延迟都进行切换。因此,在进行容灾切换时,可能会导致RPO(Recovery Point Objective)大于零,出现一定程度的数据丢失。
说明RPO(Recovery Point Objective)即数据恢复点目标,指应用发生故障时预期的数据丢失量。
容灾实例将和生产实例共用域名,域名在同一时刻仅指向其中一个实例。因此,同一时刻数据查询和写入仅能在生产或容灾实例选其一进行。
释放容灾实例后,域名将指向生产实例。
释放生产实例后:
生产实例上绑定的只读从实例会被置为待绑定状态。
容灾实例将使用自身域名,容灾实例和生产实例之间的数据同步关系会断开。
配置容灾
目前生产实例绑定容灾实例需要由Hologres运维人员后台操作,您可以加入Hologres钉钉交流群进行申请,详情请参见如何获取更多的在线支持?。
绑定时,您需要提供以下信息:
信息 | 描述 | 样例 |
容灾名称 | 自定义名称。 最大支持32个字符。 | 北京Region容灾实例 |
生产实例ID | 主实例的ID。 | hgpostcn-cn-1xxxxx |
容灾实例ID | 作为灾备实例的ID。 | hgpostcn-cn-2xxxxx |
生产实例绑定容灾实例后,您可以在云监控中查看实例间文件同步延迟,详情请参见查看监控指标。
查看容灾信息
绑定完成后,您可在Hologres管理控制台中查看绑定的容灾关系以及容灾详情。
操作步骤如下:
在顶部菜单栏左侧,选择相应的地域。
在左侧导航栏单击容灾管理。
在容灾管理页面,单击目标容灾操作列的管理,进入容灾详情页。
容灾详情页中为您提供当前容灾的基础信息、生产实例信息、灾备实例信息以及网络信息。
异常切换
使用场景
异常切换是生产实例故障或容灾异常情况下进行的主备实例切换操作。当生产实例发生故障且容灾实例处于待机状态时,您可根据实际情况自行判断是否将容灾实例切换成主实例。
重要生产实例故障时,如存在部分数据未同步至容灾实例。容灾实例异常切换成主实例后,将缺失这部分数据。因此,您在进行异常切换时,请确认容灾数据同步的最后时间,务必谨慎操作。
使用步骤
在顶部菜单栏左侧,选择相应的地域。
在左侧导航栏单击容灾管理。
在容灾管理页面,单击目标容灾操作列的异常切换。
说明触发异常切换后,实例立刻开始切换。因此,RPO(Recovery Point Objective)在理论上会大于等于当前同步延迟。
在异常切换对话框中,单击异常切换。
异常切换时,容灾情况显示为异常切换中,切换完成后,容灾情况更新为建立同步链路中。
说明切换完成后,容灾域名将指向容灾实例,您可以使用容灾域名进行数据查询和写入。
系统会自动建立由容灾实例向生产实例同步数据的链路。