应急预案:RDS-Proxy单台物理机宕机的应急处理方法

1. 概述

本文主要介绍在专有云V3环境中,RDS-Proxy单台物理机宕机时的应急处理方法。

1.1. 适用范围

  • 专有云V3企业版,RDS

1.2. 用户告知

  • 适用平台:x86
  • 授权级别:L2(二线技术支持工程师)
  • 临时或固化方案:固化
  • 操作复杂度:中
  • 预估执行时长:20分钟
  • 业务影响:否
    说明:RDS-Proxy一般输出是由三台Proxy机器做高可用。在一台机器宕机的情况下,仍有另外两台机器可提供服务,但是分配在该机器上的连接会中断,业务侧重新发起连接即可。
  • 风险等级:中

2. 问题描述

RDS-Proxy主机由于某种原因宕机,需要对该机器进行重启。

3. 解决方案

3.1. 环境检查

  1. 登录天基控制台,选择监控中心>报警历史,查看是否有RDS-Proxy机器宕机的告警。
  2. 如果存在RDS-Proxy机器的宕机告警,选择运维>机器运维,检查机器状态,确认告警机器状态异常。

3.2. 实施步骤

  1. 登录天基控制台,在集群页签下搜索proxy,选择proxy-A-XXXX集群。
  2. 机器页签下搜索宕机的机器,单击机器右侧的Dashboard
    Image 137.png
  3. 机器详情页面,单击操作菜单右侧的下拉按钮,选择机器操作
  4. 操作机器页面,选择操作方式为带外重启,单击确认

3.3. 结果验证

重启完成之后,确认机器能够正常登录。

4. 回滚方案

机器重启无回滚操作。