托管节点池概述

更新时间: 2023-07-10 12:24:26

托管节点池是ACK全新推出的自动化运维型节点池,可以自动完成部分节点运维操作,例如高危CVE漏洞自动修复、部分故障修复等,从而降低您的节点运维负担。本文介绍托管节点池的基本信息、适用场景、主要特征以及与普通节点池的差异。

索引

注意事项

  • 托管节点池通过替换系统盘的方式执行节点升级操作,该操作会删除节点系统盘上的数据。数据盘内的数据不受影响,请勿在系统盘上存储任何持久化数据。

  • 托管节点池在替盘升级前会执行节点下线与排水,因此会造成Pod的重启、长链接的中断。

  • 托管节点池会尝试重启故障节点来修复可能的故障,因此节点上的Pod会被重启。

  • 托管节点池支持CVE漏洞修复,使用该功能需要开通云安全中心并且配额充足。具体操作,请参见购买云安全中心

  • ACK建议您务必开启事件中心,否则将无法接收托管节点池的告警事件。关于开启事件中心的具体操作,请参见事件监控

  • ACK建议您务必安装ack-node-problem-detector,否则将无法检测节点的异常情况。关于ack-node-problem-detector的具体说明,请参见ack-node-problem-detector

托管节点池概览图

托管节点池

适用场景

  • 只关注上层应用开发,不希望花费过多精力运维Worker节点。

  • 对底层节点的变更不敏感,业务Pod对迁移有较高的容忍度,更加关注业务的弹性而非不可变性。

主要特征

  • 支持在同一集群下创建多个不同规格的托管节点池。

  • 执行替盘轮转升级前会先尝试通过cordon命令将节点设置为不可调度,然后驱逐该节点上的Pod。如果超时15分钟后,Pod仍未被驱逐,容器服务将强制执行替盘操作。

  • 托管节点池会监控节点的运行状态,如果节点超过10分钟未上报节点状态,或者状态为NotReady,容器服务会通过尝试重启节点来恢复节点。

托管节点池与普通节点池对比

  • 普通节点池:为您提供管理一组同质节点的能力,同一个节点池内具有相同的节点配置,例如规格、标签(Label)、污点(Taint)。您可以自行运维普通节点池内节点。

  • 托管节点池:在普通节点池基础上,提供高危CVE漏洞自动修复能力,自动触发故障节点修复等能力,从而实现托管的自动化节点运维。

说明

在集群和节点池运行状态正常的情况下,您可以在节点池列表的操作列,单击开启托管关闭托管,转换节点池类型。

托管节点池与普通节点池具体的对比项及说明如下表所示。

对比项

普通节点池

托管节点池

运维能力

用户自行管理。

部分运维托管于容器服务。

运维窗口

无需设置运维窗口。

需要设置运维窗口。托管节点池会在您设定的运维窗口内执行自动化的运维操作,例如修复高危CVE漏洞。

故障修复

手动。

自动。

说明
  • 托管节点池的自动运维能力可以帮助您简化节点运维工作,部分复杂的节点故障可能仍需要人工修复。关于节点自动恢复的更多信息,请参见托管节点池节点自动恢复

  • 如果需要关闭托管节点池的自动运维功能,请在控制台集群信息页面的基本信息页签中关闭维护窗口。具体操作,请参见查看集群信息

CVE修复

用户手动触发CVE修复。

自动触发高危CVE漏洞修复。

说明

CVE修复是云安全中心提供的高级功能。如需使用该功能,您需要先购买云安全中心的企业版或以上版本,ACK不额外收取费用。更多信息,请参见漏洞修复

节点组件升级

手动。

自动。

kubelet小版本升级

手动。

自动。

ContainerOS极速扩容

不支持。

支持。

千节点扩容P90节点就绪仅需53s,相较于CentOS千节点扩容P90节点的330s有较大优势。

说明

ContainerOS是为容器场景垂直优化的阿里云官方操作系统,完全兼容现有的Kubernetes生态。有关ContainerOS的更多信息,请参见ContainerOS概述

操作系统

支持以下操作系统。

  • Alibaba Cloud Linux

  • CentOS

  • Windows

支持以下操作系统。

  • Alibaba Cloud Linux

  • CentOS

相关文档

阿里云首页 容器服务 Kubernetes 版 ACK 相关技术圈