应急预案:AnalyticDB产品FN、BN、CN节点的重启方法

应急预案:AnalyticDB产品FN、BN、CN节点的重启方法

更新时间:2020-06-09 10:26:28

1. 概述

本文主要介绍专有云环境中,AnalyticDB产品FN、BN、CN节点的重启方法。

1.1. 适用范围

  • 专有云V2,AnalyticDB
  • 专有云V3,AnalyticDB

1.2. 用户告知

  • 适用平台:x86
  • 授权级别:L2(二线技术支持工程师)
  • 临时或固化方案:临时、固化
  • 操作复杂度:中
  • 业务影响:是
    说明:AnalyticDB的节点为双副本,使用单个节点重启的方式重启多个CN节点,和使用副本的方式重启节点时,需要逐个副本进行操作。确保操作的第一个副本数据恢复后,再操作另一个副本。
  • 风险等级:高
    说明
    • 单个节点重启:AnalyticDB的节点为双副本,重启一个副本的单个节点,理论上不影响业务。多个CN节点重启时,需要注意不能同时重启同一副本的CN节点,且严格禁止涉及两个副本的多个节点同时或短时间内进行重启,且需要确认数据恢复正常。
    • 按副本重启:AnalyticDB的节点为双副本,重启一个副本后,另一副本也能正常提供服务。FN、BN节点重启速度较快,理论上不影响业务。重启CN节点的时间受到数据量大小和ECU个数的影响,数据量越大、ECU个数越多,单副本重启数据恢复时间越慢。

2. 问题描述

AnalyticDB产品的节点受到异常SQL、业务压力大等因素出现异常,例如严重的内存溢出、节点的PID不正常、数据恢复异常等,则需要重启节点进行恢复。

3. 解决方案

详情请参见以下KB文档。

  • KB 118907 通用方案:AnalyticDB产品FN、BN、CN节点的重启方法