ACK Pro 集群的控制面采用弹性伸缩架构,在超大规模集群或突发高并发场景下,弹性扩容的响应延迟可能影响业务连续性。ACK Pro 预设控制面通过预先分配并固化控制面资源,确保 API 并发与 Pod 调度能力始终处于确定的高水平状态,适用于 AI 训练推理、超大规模集群及关键任务型业务。
ACK Pro 集群可根据集群实际负载动态调整 API Server、etcd 等控制面组件的资源配置,适用于大多数常规场景。但在超大规模集群或突发高并发场景下,弹性扩容的响应延迟可能影响业务连续性。例如,大规模 AI 训练批量启动 Pod 时,可能出现调度等待甚至无效 Pod;高并发高峰期 API 操作响应变慢,进而影响业务连续性。
ACK Pro 预设控制面通过固化控制面资源和API Server 基线配置,从源头消除弹性扩容的不确定性,而非依赖弹性机制事后追赶,以保障控制面性能始终可预期。
ACK Pro预设控制面与现有ACK Pro控制面并行存在,预设模式的推出不影响现有集群的运行逻辑。
适用场景
AI 训练与推理
大规模 AI 训练任务涉及数万个 Pod 的并发创建与调度,且通常要求调度完成后立即开始计算。弹性控制面的扩容延迟可能产生无效 Pod 或中断训练进程。预设控制面确保训练启动时调度能力即刻就绪。
大规模集群部署
面向 Agent 应用、微服务集群等持续承受高并发 API 请求的场景,预设控制面通过标准化的规格管理简化大集群运维,降低复杂度。
关键任务型 Web 应用
对于延迟敏感的核心业务,控制面响应延迟可能直接影响业务可用性。预设控制面提供确定性的 API 并发处理能力和 Pod 调度速率,保障业务连续性。
档位介绍
档位规格
预设控制面共三个档位,通过三个核心指标定义控制面容量。
下表提供了控制面容量上限,实际性能还取决于工作负载模式、配置情况及对 Kubernetes 最佳实践的遵循情况。推荐参见最佳实践配置集群及工作负载。
Pro 4XL需联系客服开通白名单
性能指标 | Pro XL | Pro 2XL | Pro 4XL |
API 请求并发数(Seats)① | 3,900 | 7,800 | 15,600 |
Pod 调度速率(个/秒)② | 200 | 400 | 600 |
etcd 数据库大小(GB)③ | 16 | 16 | 16 |
各指标说明:
① API 请求并发数(Seats):以Seats(席位数)衡量 API 请求的最大并发能力。预设控制面通过固化 API Server 基线资源,确保高并发场景下的请求处理能力。
② Pod 调度速率(个/秒):集群调度器每秒将 Pod 调度至节点的速率。预设控制面通过固定资源配额保障调度速率的确定性。
③ etcd 数据库大小:存储集群全量状态的键值数据库容量。预设控制面采用固化 etcd 架构(Pro 为共享 8 GB),部分档位还支持 Events 数据独立存储,避免高频事件写入影响核心状态操作的性能。
档位切换规则
档位切换支持 Pro / Pro XL / Pro 2XL / Pro 4XL 之间的升档或降档操作,如 Pro → Pro XL、Pro XL → Pro 2XL。
切换至 Pro 4XL 需联系客服开通白名单
不支持切换至ACK托管集群基础版。
不支持自动升降档:预设控制面不会自动在档位之间切换。选定档位后,控制面将固定在该规格运行,以保证性能稳定可预期。如需根据负载动态调整档位,需参考控制面监控指标手动实现升降档。
与ACK Pro控制面的对比
维度 | ACK Pro控制面 | ACK Pro预设控制面 |
控制面资源配置 | 弹性伸缩,按负载动态调整 | 预分配固定容量,始终充足 |
API 并发保障 | 动态变化,上限不超过 Pro XL | 各档位明确 Seats 规格 |
Pod 调度速率保障 | 动态变化,上限不超过 Pro XL | 各档位明确 Pods/秒数值 |
etcd 配置 | 8 GB | 16 GB |
计费方式 | 资源包或按量付费 | 仅按量付费 |
适用场景 | 常规业务,可接受弹性响应延迟 | 大规模、高并发、性能确定性要求严苛 |
计费说明
预设控制面仍然沿用ACK托管集群Pro版的计费逻辑。
计费上报按整点触发,每个整点系统根据当前集群所处的控制面档位进行计费。
档位切换后,新计费标准从切换时点所在整点起生效。例如,当天10:20从Pro切换至Pro XL,则在11:00整点计费周期内(10:00~11:00)均按Pro XL价格计费。
仅支持按量付费模式。现存的ACK托管集群Pro版的预付费模式资源包仅针对ACK Pro集群,不适用于新增的预设控制面档位。
详见集群管理费用。
注意事项
选择最优档位:若要为集群选定最优预设控制面档位,可先切换至较高档位,执行压力测试模拟峰值负载,观察控制面资源使用率,再选定合适档位。
回退限制:ACK Pro 控制面的 etcd 数据库容量上限为 8 GB。集群在预设控制面模式下运行期间,若 etcd 数据库使用量超过 8 GB,则需先将数据库容量降至 8 GB 以下,方可切换回ACK Pro 控制面。
数据面组件扩容:启用预设控制面后,建议同步关注数据面组件(如 CoreDNS、metrics-server 等)的资源使用水位,根据实际负载合理扩容,避免数据面成为业务性能瓶颈。
开始使用
支持在创建集群时或者创建后配置相应的预设控制面档位。
如需升级,详见升级集群。
创建集群时选择
默认情况下,创建流程与ACK托管集群Pro版一致。需主动选择预设控制面的档位,以启用该能力。
登录容器服务管理控制台,在左侧导航栏选择集群列表,然后单击创建集群。
在控制面配置(集群配置)环节,按照页面提示选择集群规格为预设控制面的档位(Pro XL、Pro 2XL 或 Pro 4XL)。
完成集群创建后,控制面会以所选档位的规格运行。
已有集群切换
对于存量ACK Pro集群,可通过查看集群控制面组件监控大盘,查看当前控制面资源使用情况。根据资源水位告警,或在预判业务即将进入高峰期时,发起档位升级。
-
在ACK集群列表页面,单击目标集群名称,选择集群信息。
单击基本信息页签,在基本信息的集群规格区域,按照页面提示启用或配置预设控制面档位。
附录:服务等级协议(SLA)
ACK Pro 预设控制面是 ACK Pro 集群新增的档位,提供与 ACK Pro 集群相同水平的协议保障。详见阿里云容器服务Kubernetes版服务等级协议说明。