应急预案:升级到专有云V3.5后5U操作系统的Docker宿主机负载过高

应急预案:升级到专有云V3.5后5U操作系统的Docker宿主机负载过高

更新时间:2020-06-08 21:06:29

1. 概述

本文主要介绍由低版本升级到专有云V3.5后,5U操作系统Docker宿主机负载过高的解决方法。

1.1. 适用范围

  • 专有云V3企业版,基础服务设备
    说明
    • 在由低版本升级到V3.5,且底座是5U操作系统的环境中,所有Docker宿主机都需要进行此变更。
    • 当出现负载过高的问题时,先由阿里云技术支持排查确认问题相似后,再使用此变更方案。

1.2. 用户告知

  • 适用平台:x86
  • 授权级别:L2(二线技术支持工程师)
  • 临时或固化方案:临时
  • 操作复杂度:低
  • 预估执行时长:15分钟
  • 业务影响:否
  • 风险等级:低
    说明:无风险。

2. 问题描述

专有云V3.5之前的版本升级到V3.5后,5U系统的Docker宿主机存在负载过高现象。经过排查,确认5U内核释放Docker缓存的处理方式存在问题,属于5U内核的BUG,暂时没有解决BUG的方法。此现象短期的解决方法采用物理机定期清理缓存来缓解问题,长期的方法则需要升级到7U内核。

3. 解决方案

详情请参见以下KB文档。

  • KB 114524 通用方案:升级到专有云V3.5后5U操作系统的Docker宿主机负载过高