当集群的容量规划无法满足应用Pod调度时,您可以使用节点自动伸缩方案实现节点的自动扩缩。节点自动伸缩适用于扩容规模较小(例如开启弹性的节点池数量少于20,或对应节点池中的节点数量少于100),工作负载批次较为稳定,以单次伸缩为主等业务场景。
阅读前提示
为了让您更好地使用节点自动伸缩功能,建议您在阅读本文档前,已阅读节点伸缩概述并了解以下内容:
节点自动伸缩的工作原理与功能特性
哪些业务场景下,节点自动伸缩可以满足您的业务诉求
使用节点自动伸缩前需要了解的注意事项
前提条件
步骤一:开启节点自动伸缩
使用节点自动伸缩功能前,您需要在节点池页面开启并配置集群自动弹性伸缩,使节点具备伸缩能力。配置时,请选择节点伸缩方案为自动伸缩。
登录容器服务管理控制台,在左侧导航栏选择集群。
在集群列表页面,单击目标集群名称,然后在左侧导航栏,选择 。
在节点池页面,单击节点伸缩后方的去配置。
首次使用集群自动弹性伸缩功能时,按照页面提示,开通ESS服务并完成授权(如已开通并授权,请跳过)。
ACK托管集群:完成AliyunCSManagedAutoScalerRole角色授权。
ACK专有集群:完成KubernetesWorkerRole角色授权和AliyunCSManagedAutoScalerRolePolicy系统策略的授权,入口如下所示。
在节点伸缩配置页面,选择节点伸缩方案为自动伸缩,配置伸缩的配置项,然后单击确定。
配置
说明
节点池扩容顺序策略
随机策略:存在多个可扩容节点池时,从中任意选择一个节点池进行扩容。
默认策略:存在多个可扩容节点池时,从中选择一个资源浪费最少的节点池进行扩容。
优先级策略:存在多个可扩容节点池时,会按照您自定义的顺序选择优先级高的节点池进行扩容。
需在创建开启了弹性的节点池后再操作。
弹性灵敏度
用于调整系统判断伸缩的间隔时间。默认值为60s。
实施弹性伸缩时,弹性组件会基于调度情况自动触发扩容。您只需配置缩容条件。
重要ECS节点:仅当同时满足缩容阈值、缩容触发时延和静默时间三个条件时,弹性组件才有可能执行节点缩容。
GPU节点:仅当同时满足GPU 缩容阈值、缩容触发时延和静默时间三个条件时,弹性组件才有可能执行GPU节点缩容。
允许缩容
是否允许进行节点缩容。关闭时,缩容相关配置不生效。请谨慎设置。
缩容阈值
启用节点自动伸缩的节点池中,单个节点的请求资源(Request)与单个节点资源容量的比值。
仅当该比值低于配置的阈值时,即节点的CPU和内存资源利用率均低于缩容阈值时,节点才有可能被缩容。
GPU 缩容阈值
GPU实例的缩容阈值。
仅当该比值低于配置的阈值时,即节点的CPU、内存和GPU资源利用率均低于GPU 缩容阈值时,GPU节点才有可能被缩容。
缩容触发时延
从检测到有缩容需求(达到缩容阈值)到实际执行缩容操作(缩容Pod数量)之间的时间间隔。单位:分钟。默认值:10分钟。
重要仅当满足缩容阈值配置,且达到缩容触发时延后,弹性组件才有可能执行节点缩容。
静默时间
距离最近一次扩容完成后,弹性组件不执行缩容的时间间隔。
在静默时间内,弹性组件不会缩容节点,但仍会判断节点是否可以缩容;超过静默时间后,如果节点满足缩容阈值和缩容触发时延两个条件,弹性组件则会正常执行缩容。例如,当静默时间为10分钟,缩容触发时延为5分钟时,弹性组件在最近一次扩容后的10分钟内不会缩容节点,但会在静默的10分钟内判断节点是否符合缩容条件。等待静默时间结束,节点达到缩容阈值且时间超过缩容触发时延规定的5分钟时,弹性组件会继续执行缩容。
步骤二:配置开启弹性的节点池
节点自动伸缩的扩缩对象为开启自动伸缩节点池的节点。因此,配置节点自动伸缩后,您还需要配置至少一个开启了弹性的节点池。您可以新建一个开启自动弹性伸缩的节点池,也可以配置已有节点池,为其开启自动弹性伸缩功能。
下表介绍主要配置项,其中“节点池”均指“开启弹性的节点池”。更多信息,请参见创建节点池、编辑节点池。
配置 | 说明 |
自动伸缩 | 是否开启自动伸缩。自动伸缩可根据业务需求和策略,经济地自动调整弹性计算资源的管理服务。更多信息,请参见弹性伸缩概述。开启前,请先配置节点池的自动弹性伸缩能力,操作步骤可参考步骤一:开启节点自动伸缩。 |
实例相关的配置项 | 根据实例规格或属性选择Worker节点池使用的ECS实例,可通过vCPU、内存、规格族、架构等属性进行筛选。 节点池扩容时,将从选中的实例规格中扩容。具体扩容到的实例规格取决于节点池扩缩容策略。选择的实例规格越多,节点池成功弹出节点的概率越大。 节点池内实例的规格。单一规格的ECS实例库存容量波动较大,建议配置多种相同规格的实例类型,以提高节点伸缩成功率。 如果您选择的实例均为GPU服务器,您可以按需开启共享 GPU 调度。更多信息,请参见共享GPU调度概述。 |
实例数量 | 节点池所包含的实例数量(不包含您已有的实例)。 默认情况下,实例数最少为0。超过0时,集群会默认向节点池中添加实例,并将实例加入到节点池对应的ACK集群中。 |
操作系统 | 在开启自动伸缩时,支持选择Alibaba Cloud Linux、Windows镜像、Windows Core镜像。 当所选镜像是Windows镜像或Windows Core镜像时,系统将自动配置污点(Taints) |
节点标签 | 在集群中添加节点标签(Label)后,会自动添加到弹性伸缩扩容出的节点上。 重要 当节点标签和污点配置映射到节点池Tag后,自动伸缩才可识别,且节点池Tag存在数量上限。因此,请将开启自动伸缩的节点池配置的ECS标签、污点和节点标签的总数控制在12个之内。 |
扩缩容策略 |
|
伸缩模式 | 支持标准模式和极速模式。
|
污点 (Taints) | 添加污点后,集群将不会将Pod调度到该节点上。 |
创建开启了弹性的节点池后,您可以参见步骤一:开启节点自动伸缩选择是否配置优先级策略。优先级取值范围为[1, 100],必须为正整数。
步骤三:(可选)结果验证
完成如上操作后,您便可以使用节点自动伸缩功能。此时,节点池将显示已开始自动伸缩且集群已自动安装cluster-autoscaler组件。
节点池已开启自动伸缩
在节点池页面,节点池列表中将展示已开启自动伸缩的节点池。
已安装cluster-autoscaler组件
在集群管理页左侧导航栏,选择 。
选择kube-system命名空间,显示cluster-autoscaler组件。
常见问题
分类 | 二级分类 | 跳转链接 |
节点自动伸缩的扩缩容行为 | ||
缩容行为相关 | ||
拓展支持 | ||
自定义的扩缩容行为 | 通过Pod控制扩缩容行为 | |
通过节点控制扩缩容行为 | ||
cluster-autoscaler组件相关 |