应急方案:专有云环境中物理机宕机的处理方法

应急方案:专有云环境中物理机宕机的处理方法

更新时间:2020-07-24 14:23:16

1. 概述

本文主要介绍在专有云环境中,物理机宕机的处理方法。

1.1. 适用范围

  • 专有云V2企业版,基础服务设备
    说明:专有云V2环境仅可使用带外控制台的操作步骤。
  • 专有云V3企业版,基础服务设备

1.2. 用户告知

  • 适用平台:x86、ARM
  • 授权级别:L1(一线驻场工程师)
  • 临时或固化方案:临时
  • 操作复杂度:低
  • 业务影响:是
    说明:已发生宕机,实施此方案无影响。
  • 风险等级:低

2. 问题描述

在专有云环境中,物理机宕机,需要进行处理。

3. 解决方案

3.1. 环境检查

  • 在专有云V3环境,确认天基控制台可正常使用。
  • 专有云V2环境,确认可以正常登录带外控制台。
    说明:专有云V2环境只能使用带外控制台。

3.2. 实施步骤

在天基控制台的处理方法

说明:在天基控制台操作带外重启,会下发Action,该机器上的服务角色会依次审批Action,全部审批完毕后才会执行重启操作。

  1. 登录天基控制台,选择运维>机器运维,过滤异常机器的主机名,单击机器右侧的机器操作
  2. 操作机器提示框中,选择带外重启,单击确认

在带外控制台的处理方法

注意:不同厂家带外控制台界面有所不同,若带外控制台不通,则需立即联系机房工程师,现场协助重启。

  1. 在浏览器中输入需要重启的物理机带外IP,登录带外控制台。
  2. 单击远程控制,选择重启服务器,执行重启操作。

    JVM带外控制台操作方法:登录JVM带外控制台,单击电源按钮,单击强制重启

3.3. 结果验证

物理机可正常开机,且运行正常。

4. 回滚方案

无需回滚,操作前的情况已是非正常状态。