为了提升集群的稳定性,建议您将ACK NPD(ack-node-problem-detector)组件升级到1.2.8版本以上。
背景信息
低于v1.2.8版本的ack-node-problem-detector组件会默认开启文件系统句柄巡检项(check_fd),check_fd的进程在读取大内核数据时,会触发部分操作系统内核版本缺陷,可能会造成僵尸进程堆积、甚至宕机的风险。
升级组件
为避免低版本组件可能导致的问题,满足内核版本条件的集群,请升级ack-node-problem-detector组件至1.2.8版本以上,即可默认停止文件系统句柄巡检项(check_fd),避免读取大内核数据。ack-node-problem-detector组件升级信息,请参见ack-node-problem-detector。
修复内核缺陷。更多信息,请参见Alibaba Cloud Linux 2系统的ECS实例中Page Fault异常导致系统宕机 。
登录容器服务管理控制台,在左侧导航栏选择集群列表。
在集群列表页面,单击目标集群名称,然后在左侧导航栏,选择 。
在组件管理页面的日志与监控页签下,单击ack-node-problem-detector右下方的升级。
若ack-node-problem-detector面板上无升级按钮,说明当前组件已是最新版本,无需升级。
在弹出提示框中,单击确定。
该文章对您有帮助吗?
- 本页导读 (1)
- 背景信息
- 升级组件