Hologres基于3AZ的同城容灾能力,支持将实例的可用性从单一可用区扩展到同城三个可用区,提供跨可用区级别的故障隔离能力,确保业务系统不会因为单一可用区故障而中断服务,可用于应对运营商网络故障、单可用区计算设置故障等场景,提升业务的容灾能力。
背景信息
Hologres基于3AZ的同城容灾包含3AZ存储容灾和迁移计算节点高可用,具体如下:
3AZ存储节点同城容灾:又名同城冗余存储,是指支持将一个实例的数据存储在同一个Region的多个可用区,当某个可用区的存储机房不可用时,同城冗余存储会自动访问副本可用区,保障数据的正常访问,以此提供机房级别的同城容灾。
迁移计算节点高可用:如果实例是同城冗余存储类型,当计算机房发生故障时,如果目标可用区的计算资源充足,可以通过手动切换可用区的方式将计算节点迁移至正常可用区,以此来规避计算机房的故障,提升计算层的高可用性。
注意事项
3AZ存储节点同城容灾
功能介绍
3AZ存储节点同城容灾,是指其实例的存储冗余类型为同城冗余存储(同城容灾),该存储类型可以将数据冗余存储在同一地域的多个可用区,当某个可用区的存储机房不可用时,同城冗余仍然能保障数据的正常访问,提供机房级别的同城容灾能力。
新购实例时请选择存储冗余类型为同城冗余存储(同城容灾),如果是存量实例,类型为本地冗余存储,详情请参见普通实例转换为3AZ同城容灾实例。
技术原理
当实例的存储冗余类型为本地冗余存储时,实例的存储节点默认部署在同一个Region的一个可用区,当该可用区的存储机房不可用时,会导致相关数据不可访问。
当实例的存储冗余类型为同城冗余存储时,会默认将实例的数据存储在同一个Region的多个可用区。实例所在的可用区为主可用区,其余可用区为底层物理机已部署的可用区。
其余可用区是指底层物理机器所在的可用区,系统会根据实例所在的主可用区自动选择其余可用区,用户无需关心是哪个可用区。
当发生数据写入时:多个可用区同时写入,只有当所有可用区都写入完成,才返回结果,如果有一个失败,那么所有可用区的写入都一起失败,存储系统会强保证写入的原子性。
当存在查询时:会优先从实例所在的可用区查询数据,当实例所在的可用区发生故障不可读取数据时,会自动路由到最近的副本可用区查询数据,保证服务的连续性和可用性。
存储容灾恢复指引
当实例所在的可用区发生存储机房故障时,您将会收到Hologres关于故障情况的短信或邮件通知。Hologres会进行一次恢复操作,具体如下:
Hologres会自动进行存储的可用区切换,无需业务做任何操作,业务自动恢复。
切换存储的可用区后,会继续将数据写入正常可用区,不受故障可用区影响,查询会自动路由到与实例最近的可用区上存储的数据,业务无需做任何的改造,若故障期间有作业运行失败,请执行重跑操作。
您只需关注业务运行情况,确保业务整体恢复正常。
计费说明
将按照同城冗余存储的单价收费,相比普通实例,仅增加了存储费用,详情请参见计费概述。
迁移计算节点高可用
计算容灾恢复指引
若实例的存储冗余类型为同城冗余存储(同城容灾),Hologres提供手动切换计算可用区的能力来实现迁移计算节点高可用,从而快速恢复业务。
当实例所在的计算可用区发生故障时,您将会收到Hologres关于故障的短信或邮件通知。您可以手动执行如下操作进行恢复:
您可以前往Hologres管理控制台,在实例列表页面单击目标实例ID,进入实例详情页面。
在实例左侧导航栏单击备份与容灾,并切换至同城容灾页签。
在计算容灾区域单击计算故障切换可用区。
如果目标可用区计算资源充足,您可以在计算故障切换可用区的对话框中选择对应的计算容灾可用区,然后单击确定,进行计算节点的可用区迁移。
说明如果目标可用区计算资源不足,将无法切换,请及时提交工单或加入实时数仓Hologres交流群,反馈给Hologres技术支持。
迁移完成后,实例的Endpoint等基础配置均不会改变,当实例状态为运行中时,若有失败作业请及时重跑恢复,并持续关注业务运行情况,直至全部恢复。
注意事项
仅存储冗余类型为同城冗余存储(同城容灾)的实例支持手动切换计算可用区,实现计算容灾,若您的实例为本地冗余存储,请参照普通实例转换为3AZ同城容灾实例进行操作。
在手动切换计算可用区时,如果目标可用区计算资源不足,将无法切换,请及时提交工单或加入实时数仓Hologres交流群,反馈给Hologres技术支持。
手动迁移计算可用区后,实例的Endpoint、网络配置等基础配置均不会改变。
计费说明
手动迁移计算可用区后,不会额外产生计算费用。
普通实例转换为3AZ同城容灾实例
若实例的存储冗余类型为本地冗余存储,表示实例的数据仅存储在同一个Region的一个可用区,当该可用区的存储机房不可用时,会导致相关数据不可访问。
若您的业务需要具备同城容灾能力,请提交工单或加入实时数仓Hologres交流群,由Hologres运维人员后台进行转换。但需注意:
仅V3.0.19及以上版本的Hologres实例支持同城冗余存储,若您的实例版本低于V3.0.19,请您使用实例升级或加入实时数仓Hologres交流群,申请升级实例,详情请参见如何获取更多的在线支持?。
转换过程的影响:
操作过程中,实例将会停写不停读,若您的作业有自动Failover,可以无需手动停止作业。
转换的时间与实例中的表数量有关,预计大部分实例能在10分钟内完成操作。具体时间请Hologres技术支持人员进行评估。
转换完成后,存储费用会根据同城冗余存储的单价进行计费,存储费用将会上涨,请及时关注账单。