应急预案:专有云盘古普通磁盘维修

应急预案:专有云盘古普通磁盘维修

更新时间:2020-06-08 21:07:21

1. 概述

盘古作为底层的存储系统,管理数量巨大的数据磁盘,数据磁盘有正常的损耗,会出现磁盘损坏的情况。本文主要介绍专有云盘古普通磁盘损坏后的更换。

1.1. 适用范围

  • 专有云V2企业版,盘古
  • 专有云V3企业版,盘古
    说明:本方案适用于盘古的版本为0.14和0.15.3的专有云V2环境,以及盘古的版本为0.16、0.16.1、0.16.2的专有云V3环境。

1.2. 用户告知

  • 适用平台:x86、ARM
  • 授权级别:L1(一线驻场工程师)
  • 临时或固化方案:固化
  • 操作复杂度:低
  • 预估执行时长:4小时
  • 业务影响:否
    说明:对ots_inner集群中的盘古普通盘更换时,会影响到galaxy_inner集群。
  • 风险等级:低
    说明
    • 维修过程需要重启pangu_chunkserver进程,磁盘IO操作会受到影响,操作需要控制维修节奏。
    • 请在数据安全性检查通过的情形下执行换盘操作。

2. 问题描述

专有云盘古普通磁盘损坏时,会影响服务的性能和稳定性。为了不影响业务,可以对磁盘进行更换操作。

3. 解决方案

详情请参见以下KB文档。

  • KB 71921 通用方案:专有云盘古普通磁盘维修