托管节点池概述
托管节点池是ACK全新推出的自动化运维型节点池,可以自动完成部分节点运维操作,例如高危CVE漏洞自动修复、部分故障修复等,从而降低您的节点运维负担。本文介绍托管节点池的基本信息、适用场景、主要特征以及与普通节点池的差异。
索引
注意事项
托管节点池通过替换系统盘的方式执行节点升级操作,该操作会删除节点系统盘上的数据。数据盘内的数据不受影响,请勿在系统盘上存储任何持久化数据。
托管节点池在替盘升级前会执行节点下线与排水,因此会造成Pod的重启、长链接的中断。
托管节点池会尝试重启故障节点来修复可能的故障,因此节点上的Pod会被重启。
托管节点池支持CVE漏洞修复,使用该功能需要开通云安全中心并且配额充足。具体操作,请参见购买云安全中心。
ACK建议您务必开启事件中心,否则将无法接收托管节点池的告警事件。关于开启事件中心的具体操作,请参见事件监控。
ACK建议您务必安装ack-node-problem-detector,否则将无法检测节点的异常情况。关于ack-node-problem-detector的具体说明,请参见ack-node-problem-detector。
托管节点池概览图

适用场景
只关注上层应用开发,不希望花费过多精力运维Worker节点。
对底层节点的变更不敏感,业务Pod对迁移有较高的容忍度,更加关注业务的弹性而非不可变性。
主要特征
支持在同一集群下创建多个不同规格的托管节点池。
执行替盘轮转升级前会先尝试通过cordon命令将节点设置为不可调度,然后驱逐该节点上的Pod。如果超时15分钟后,Pod仍未被驱逐,容器服务将强制执行替盘操作。
托管节点池会监控节点的运行状态,如果节点超过10分钟未上报节点状态,或者状态为NotReady,容器服务会通过尝试重启节点来恢复节点。
托管节点池与普通节点池对比
普通节点池:为您提供管理一组同质节点的能力,同一个节点池内具有相同的节点配置,例如规格、标签(Label)、污点(Taint)。您可以自行运维普通节点池内节点。
托管节点池:在普通节点池基础上,提供高危CVE漏洞自动修复能力,自动触发故障节点修复等能力,从而实现托管的自动化节点运维。
在集群和节点池运行状态正常的情况下,您可以在节点池列表的操作列,单击开启托管或关闭托管,转换节点池类型。
托管节点池与普通节点池具体的对比项及说明如下表所示。
对比项 | 普通节点池 | 托管节点池 |
运维能力 | 用户自行管理。 | 部分运维托管于容器服务。 |
运维窗口 | 无需设置运维窗口。 | 需要设置运维窗口。托管节点池会在您设定的运维窗口内执行自动化的运维操作,例如修复高危CVE漏洞。 |
故障修复 | 手动。 | 自动。 说明
|
CVE修复 | 用户手动触发CVE修复。 | 自动触发高危CVE漏洞修复。 说明 CVE修复是云安全中心提供的高级功能。如需使用该功能,您需要先购买云安全中心的企业版或以上版本,ACK不额外收取费用。更多信息,请参见漏洞修复。 |
节点组件升级 | 手动。 | 自动。 |
kubelet小版本升级 | 手动。 | 自动。 |
ContainerOS极速扩容 | 不支持。 | 支持。 千节点扩容P90节点就绪仅需53s,相较于CentOS千节点扩容P90节点的330s有较大优势。 说明 ContainerOS是为容器场景垂直优化的阿里云官方操作系统,完全兼容现有的Kubernetes生态。有关ContainerOS的更多信息,请参见ContainerOS概述。 |
操作系统 | 支持以下操作系统。
| 支持以下操作系统。
|