阿里云首页 相关技术圈

通用方案:PanguMaster如何在黑屏环境中手动切换Primary节点

1. 概述

本文主要介绍在专有云环境中,PanguMaster如何在黑屏环境中手动切换Primary节点。

方案总览

类别 内容
国产化 通用
风险等级(方案执行的影响)
操作方式 黑屏
操作复杂度
预估执行时长 N/A
客户业务的影响
可监控性 不支持
有效性(重启、重拉、补丁、升级、扩容等配置是否丢失) 临时
数据修订(变更是否涉及增删改操作)
执行灰度策略 请向产品侧咨询,明确灰度策略
首次发布时间 N/A
预计完成时间 N/A

1.1. 适用范围

  • 专有云版本:V2.*,V3.*
  • 产品:盘古

1.2. 风险说明

执行该操作前,请现场务必联系阿里云技术支持远程协助、确认。

2. 问题描述

PanguMaster所在宿主机需关机维修或者重新克隆等操作时,如该机器的PanguMaster为Primary节点,建议手动切换Primary到其他机器,将业务影响降到最低。

3. 解决方案

3.1. 环境检查

注意:本文以下操作均为admin用户执行。

  1. 登录集群AG,执行以下命令,查看Master选举状态。

    说明:专有云V3环境可选择pangu服务和PanguTool#服务角色,登录集群AG。

    puadmin gems

    系统显示类似如下,正常返回结果为1个Primary,2个Secondary。如出现“DISCONNECTED”,请停止操作,并联系阿里云技术支持处理。

  2. 执行以下命令,检查PanguMaster的同步状态。

    puadmin gss

    系统显示类似如下,正常返回的结果SyncedLogId应与PrimaryCurrentLogId一致或者接近,可多次执行,检查反馈结果是否一致或者接近。如差值不断拉大,请停止操作,联系阿里云技术支持。

  1. 执行以下命令,检查是否存在异常Chunk。

    puadmin fs -abnchunk

    系统显示类似如下,返回为空表示正常。

    如系统返回结果类似如下,请联系阿里云技术支持。

3.2. 实施步骤

执行以下命令,切换Primary节点。

puadmin ms -sp tcp://[$IP]:10260

说明:[$IP]为执行puadmin gss命令的结果中与PrimaryCurrentLogId一致的Secondary节点地址,如2个Secondary节点的SyncedLogId均与PrimaryCurrentLogId一致,则二选一即可。

系统显示类似如下。

3.3. 结果验证

执行以下命令,查看Master选举状态。确认Primary节点为实施步骤中实施的IP地址,且为1个Primary和2个Secondary节点。如返回结果为“DISCONNECTED”,请联系阿里云技术支持。

puadmin gems

系统显示类似如下。

4. 回滚方案

PanguMaster切换Primary节点,无需回滚。

 

首页 通用方案:PanguMaster如何在黑屏环境中手动切换Primary节点