本文主要介绍在专有云环境中,PanguMaster如何在黑屏环境中手动切换Primary节点。
方案总览
类别 | 内容 |
国产化 | 通用 |
风险等级(方案执行的影响) | 低 |
操作方式 | 黑屏 |
操作复杂度 | 低 |
预估执行时长 | N/A |
客户业务的影响 | 无 |
可监控性 | 不支持 |
有效性(重启、重拉、补丁、升级、扩容等配置是否丢失) | 临时 |
数据修订(变更是否涉及增删改操作) | 无 |
执行灰度策略 | 请向产品侧咨询,明确灰度策略 |
首次发布时间 | N/A |
预计完成时间 | N/A |
执行该操作前,请现场务必联系阿里云技术支持远程协助、确认。
PanguMaster所在宿主机需关机维修或者重新克隆等操作时,如该机器的PanguMaster为Primary节点,建议手动切换Primary到其他机器,将业务影响降到最低。
注意:本文以下操作均为admin用户执行。
说明:专有云V3环境可选择pangu服务和PanguTool#服务角色,登录集群AG。
puadmin gems
系统显示类似如下,正常返回结果为1个Primary,2个Secondary。如出现“DISCONNECTED”,请停止操作,并联系阿里云技术支持处理。
执行以下命令,检查PanguMaster的同步状态。
puadmin gss
系统显示类似如下,正常返回的结果SyncedLogId应与PrimaryCurrentLogId一致或者接近,可多次执行,检查反馈结果是否一致或者接近。如差值不断拉大,请停止操作,联系阿里云技术支持。
执行以下命令,检查是否存在异常Chunk。
puadmin fs -abnchunk
系统显示类似如下,返回为空表示正常。
如系统返回结果类似如下,请联系阿里云技术支持。
执行以下命令,切换Primary节点。
puadmin ms -sp tcp://[$IP]:10260
说明:[$IP]为执行puadmin gss
命令的结果中与PrimaryCurrentLogId一致的Secondary节点地址,如2个Secondary节点的SyncedLogId均与PrimaryCurrentLogId一致,则二选一即可。
系统显示类似如下。
执行以下命令,查看Master选举状态。确认Primary节点为实施步骤中实施的IP地址,且为1个Primary和2个Secondary节点。如返回结果为“DISCONNECTED”,请联系阿里云技术支持。
puadmin gems
系统显示类似如下。
PanguMaster切换Primary节点,无需回滚。