更新时间:2020-07-01 18:16
本文主要介绍专有云环境中,pai集群容器产生僵尸进程的修复方法。
说明:
- 仅适用于专有云V3.8以下版本,不包含专有云V2版本。
- 专有云V3.8.0的Hotfix已经彻底修复此问题。
说明:
- 重启容器时,需要灰度重启,每个容器重启后都要确认到达终态,再重启下一个容器,这样操作风险低。
- 超过或包含200个僵尸进程则是大量僵尸进程的情况,少于200个僵尸进程则是没有大量僵尸进程的情况。
- 本方案为临时解决方法,最终解决方法需要等待Hotfix。
pai集群PaiJcs#服务角色的pai_jcs容器和PaiCap#服务角色的pai_cap容器产生大量僵尸进程,导致宿主机无法创建新的进程,影响宿主机上其他容器。如果发现有pai_jcs和pai_cap容器,则按照以下临时解决方法,修复并预防问题。
详情请参见以下KB文档。
在文档使用中是否遇到以下问题
更多建议
匿名提交