单可用区容灾最佳实践

本文为您介绍云消息队列 Kafka 版实例选择单可用区部署,在出现可用区级别的故障时,如何快速转移故障,恢复服务正常。

背景信息

云消息队列 Kafka 版实例如果选择单可用区部署,在可用区级别的故障时,可能会出现服务完全不可用,数据丢失的风险。可以通过云消息队列 Kafka 版Connector生态集成功能,将消息备份到其他地域的备用实例中,如果出现故障,可以将流量切换到备用实例中,通过重置消息位点的方式快速恢复服务,保障服务的可用性。

image

注意事项

  • 备用实例和主实例选择不同的地域,避免地域级别故障,导致主、备实例均不可使用。

  • 当发生故障后,需要将流量切换到备用实例上,此时需要通过重置消息位点的方式快速恢复服务,需要做好幂等处理,降低消费重复带来的业务影响。

  • 建议将客户端的接入域名通过CNAME记录解析至云消息队列 Kafka 版的接入域名,以便在故障时快速切换流量。

操作步骤

步骤一:创建Connnector集成任务

具体操作请参见创建Kafka Sink Connector

步骤二:(可选)添加CNAME解析记录

具体操作请参见CNAME 记录

步骤三:客户端修改接入点

  • CNAME方式接入

    • 客户端的接入点域名需要更换为添加CNAME解析记录的域名。

    • 故障后,只需修改CNAME指向域名为备用实例接入点域名,无需重启业务应用即可快速切换流量。

  • 普通方式接入

    故障后,需要将客户端的接入点修改为备用实例接入点,重启服务后才能恢复业务。建议采用CNAME方式接入,减少因故障造成的影响。

重要

若使用中存在跨地域访问云消息队列 Kafka 版的情况,可以通过云企业网实现跨地域VPC互通