应急预案:专有云V3环境中SLB转发节点物理机自动重启的修复方法

应急预案:专有云V3环境中SLB转发节点物理机自动重启的修复方法

更新时间:2020-07-03 15:49:59

1. 概述

本文主要介绍在专有云V3环境中,SLB转发节点物理机自动重启的修复方法。

1.1. 适用范围

  • 专有云V3企业版,SLB
    说明:适用于专有云V3.0.0~V3.7.1,包含V3.0.0和V3.7.1环境。

1.2. 用户告知

  • 适用平台:x86
  • 授权级别:L1(一线驻场工程师)
  • 临时或固化方案:临时
  • 操作复杂度:低
  • 预估执行时长:60分钟
  • 业务影响:否
  • 风险等级:低
    说明:按步骤逐台操作无风险。

2. 问题描述

在专有云V3.8.X之前的版本,SLB转发节点物理机(LVS、Proxy、KeyServer)上重新拉起start进程(天基拉起,或者因机器本身故障重启,掉电重启等),会重新进行一次升级,升级过程中,会自动重启物理机。

说明:通常交付部署成功后,会建议将机器执行一次重启,如果当时没有重启,现在已经有业务的情况下,需要通过此方案进行修复。

3. 解决方案

3.1. 环境检查

在LVS、Proxy、KeyServer部署完成后,如果transform目录下只有deploy.yaml文件,此时start进程出现异常或重新拉起的情况,会执行升级流程,重启机器。登录LVS服务器,执行以下命令,确认transform目录下只有deploy.yaml文件。

ll /cloud/app/slb-lvs/SlbLvs#/slb-lvs-app/current/transform

说明

  • Proxy机器上的文件路径为/cloud/app/slb-proxy/SlbProxy#/slb-proxy-app/current/transform/
  • KeyServer机器上的文件路径为/cloud/app/slb-keyserver/SlbKeyserver#/slb-keyserverapp/current/transform/

3.2. 实施步骤

在SLB转发节点的transform目录中,检查是否存在upgrade.yaml文件:

  • 如果没有upgrade.yaml文件,需要将机器下线重启,并自动生成upgrade.yaml文件。
  • 如果有upgrade.yaml文件,则需要将此文件使用scp命令拷贝到相同角色的转发节点。
    1. 登录SLB转发节点,在transform目录中,执行以下命令,查看upgrade.yaml文件,确保upgrade.yaml文件中的每个步骤的状态都是true。
      cat upgrade.yaml
      系统显示类似如下。
    2. upgrade.yaml文件使用scp命令拷贝到相同角色的另一台机器。

3.3. 结果验证

登录到对应角色的另一台机器,执行ll命令,确认拷贝成功。

4. 回滚方案

登录SLB转发节点,删除transform目录下的upgrade.yaml文件。