应急预案:专有云V3环境中RocketMQ集群Broker节点断电方法

应急预案:专有云V3环境中RocketMQ集群Broker节点断电方法

更新时间:2020-07-23 11:42:52

1. 概述

本文主要介绍在专有云V3环境中,RocketMQ集群Broker节点的断电方法。

1.1. 适用范围

  • 专有云V3企业版,RocketMQ

1.2. 用户告知

  • 适用平台:x86、ARM
  • 授权级别:L2(二线技术支持工程师)
  • 临时或固化方案:固化
  • 操作复杂度:中
  • 预估执行时长:45分钟
  • 业务影响:否
    说明:本方案在下线Broker前会对Broker进行禁写操作,不影响业务,业务侧需评估Broker下线后集群中剩余的Broker能否支撑业务量。
  • 风险等级:中
    说明
    • 下线Broker后,定时消息会有延迟,需要确保主备节点至少禁写3天以上,紧急情况至少5小时,部分定时消息可能要到上线后才恢复或手工恢复。具体禁写多久要根据定时消息最长多久确定,如果是备节点没有要求,如果是主节点,需要禁写足够长的时间。
    • 如果一组Broker的主备节点全部下电,那么在这组Broker上电正常恢复到集群前不可操作RocketMQ控制台。
    • 如果想要操作RocketMQ控制台创建资源,那么需要将Broker上线,保证每组Broker至少有一个节点在集群中。

2. 问题描述

在专有云V3环境,由于现场维修需求或其他需求,需要对RocketMQ的Broker物理机进行下电维修。

3. 解决方案

详情请参见以下KB文档。

  • KB 156341 通用方案:专有云V3环境中MQ集群Broker节点断电方法