ACK集群概述

容器服务 Kubernetes 版拥有多种不同类型的集群。这些集群拥有不同的功能特性、运维需求以及赔付标准,适用于不同的场景。您可参照本文中的对比,选择适合您业务的集群类型。

集群类型

以集群控制面是否托管作为标准,容器服务 Kubernetes 版目前支持两种集群:

  • ACK托管集群:托管集群的控制面完全托管在阿里云上。托管版可分为ACK集群Pro版ACK集群基础版,它们的区别在于控制面的可用性保障以及高级自定义功能。

  • ACK专有集群:专有集群的控制面需要您自行创建并运维。

    重要

    ACK专有集群目前已经停止新建集群。更多信息请参见【产品公告】关于停止新建ACK专有集群的公告

您可参照下表,了解不同集群类型的区别。

比较项

ACK托管集群

ACK专有集群

ACK集群Pro版

ACK集群基础版

集群规模

单账号最多100个集群。

单集群默认支持最大5000个Worker节点,可通过配额平台申请提高配额。

单账号最多2个集群。

单集群默认支持最大10个Worker节点,不支持提高配额。

单账号最多100个集群。

单集群默认支持最大5000个Worker节点,可通过配额平台申请提高配额。

托管范围

集群控制面托管在阿里云上,由阿里云负责运维。

您需要对Worker节点进行运维。

集群控制面非托管,您需要对Master和Worker节点进行运维。

适用场景

  • 企业生产与测试环境。

  • 期望降低成本的场景。

  • 更希望关注业务应用,减少集群运维投入的场景。

集群规模上限较小,不保证集群控制面可用性,适用于个人学习与测试。

  • 对成本相对不敏感,并掌握Kubernetes技术,可以自行规划、管理、运维集群的场景。

  • 需要对Kubernetes进行研究与深度定制,例如对集群控制面(Master节点)有定制需求的场景。

收费方式

收取集群管理费用(按集群数量计费),同时对Worker节点及部分组件使用的其他阿里云产品(例如日志服务SLS)收费。

说明

ACK集群Pro版支持使用资源包,详细信息请参见资源包计费说明

不收取集群管理费用,但对Worker节点及部分组件使用的其他阿里云产品(例如日志服务SLS)收费。

不收取集群管理费用,对Master节点、Worker节点及部分组件使用的其他阿里云产品(例如日志服务SLS)收费。

SLA

区域级集群提供服务可用性99.95%的SLA保障;可用区级集群提供服务可用性99.50%的SLA保障。更多信息请参见阿里云容器服务Kubernetes版服务等级协议

不支持SLA。

ACK集群Pro版的能力优势

您可参照下方的表格,了解ACK集群Pro版ACK集群基础版的能力差异。

说明

下方表格中,对代表支持某项功能,错代表不支持某项功能。

对比项

ACK集群Pro版

ACK集群基础版

控制面组件自定义参数设置

对

错

API Server监控指标

对

错

etcd高频冷热备机制,异地容灾

对

错

etcd可观测性监控指标

对

错

Gang scheduling调度策略

对

错

CPU拓扑感知调度

对

错

GPU拓扑感知调度

对

错

共享GPU专业版调度

对

错

支持使用阿里云KMS进行Secret的落盘加密

对

错

托管节点池

对

对

热迁移

ACK集群基础版ACK专有集群都支持热迁移至ACK集群Pro版,具体操作请参见以下文档:

产品功能

功能

描述

集群管理

  • 集群创建:您可根据需求创建多种形态集群,选择类型丰富的工作节点,并进行灵活的自定义配置。更多信息,请参见创建ACK托管集群创建ACK专有集群

  • 集群升级:自动或手动升级集群的Kubernetes版本,统一管理系统组件升级。更多信息,请参见手动升级集群自动升级集群

  • 弹性伸缩:通过控制台一键垂直扩缩容来快速应对业务波动,同时支持服务级别的亲和性策略和横向扩展。

  • 调度:支持不同弹性资源的混合调度、异构资源的精细化调度、批量计算的任务调度等,提升应用的性能和集群整体资源的利用率。

  • 多集群管理:支持线下IDC和多云多区域的集群统一接入,实现混合云应用管理。

  • 授权管理:支持RAM授权和RBAC权限管理。

节点与节点池

支持节点池生命周期管理,支持在同一集群中配置不同规格的节点池,例如交换机、运行时、OS、安全组等。更多信息,请参见节点节点池概述

应用管理

  • 应用创建:支持多种类型应用,从镜像、模板的创建,支持环境变量、应用健康、数据盘、日志等相关配置。

  • 应用全生命周期:支持应用查看、更新、删除,应用历史版本回滚、应用事件查看、应用滚动升级、应用替换升级以及通过触发器重新部署应用。

  • 应用调度:支持节点间亲和性调度、应用间亲和性调度、应用间反亲和性调度三种策略。

  • 应用伸缩:支持手动伸缩应用容器实例,HPA自动伸缩策略。

  • 应用发布:支持灰度发布和蓝绿发布。

  • 应用目录:支持应用目录,简化云服务集成。

  • 应用中心:应用部署后,以统一的视角展现整体应用的拓扑结构,同时对持续部署等场景进行统一的版本管理与回滚。

  • 应用备份和恢复:支持对Kubernetes应用进行备份和恢复。更多信息,请参见集群内备份和恢复应用

存储

  • 存储插件:支持CSI存储插件。更多信息,请参见存储CSI概述

  • 存储卷和存储声明:

    • 支持创建块存储、NAS、OSS和CPFS类型的存储卷。

    • 支持持久化存储卷声明(PVC)挂载存储卷。

    • 支持存储卷的动态创建和迁移。

    • 支持以脚本方式查看和更新存储卷和存储声明。

网络

弹性伸缩

根据业务需求和策略,经济地自动调整弹性计算资源的管理服务,包括:

  • 工作负载伸缩(调度层弹性):主要负责修改工作负载的调度容量变化。

  • 节点伸缩(资源层弹性):在集群的容量规划不能满足集群调度容量时,会扩容节点资源,以补充调度容量。

更多信息,请参见弹性伸缩概述

调度

ACK针对不同任务负载提供了多种调度策略,例如任务调度、QoS感知调度、重调度等,以提升应用性能和集群整体资源的利用率。更多信息,请参见调度概述

运维与安全

  • 可观测性

    • 监控:支持集群、节点、应用、容器实例层面的监控;支持Prometheus插件。

    • 日志:支持集群日志查看;支持应用日志采集;支持容器实例日志查看。

    • 报警:支持容器服务异常事件报警,以及容器场景指标报警。更多信息,请参见容器服务报警管理

  • 集群巡检与诊断(AIOps)

    • 使用集群检查:支持在集群升级、迁移等操作前执行集群检查,确认集群是否符合要求。

    • 使用集群巡检:扫描集群运行状况,发现集群中存在的潜在风险,例如云资源配额余量、Kubernetes集群关键资源水位等,排查风险项并根据推荐的解决方案修复问题。

    • 使用集群诊断:提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。

  • 成本分析:支持可视化集群资源使用量及成本分布,以提升集群资源利用率。

  • 安全中心:支持运行时刻的安全策略管理,应用安全配置巡检和运行时刻的安全监控和告警,提升容器安全整体纵深防御能力。

  • 安全沙箱:可以让应用运行在一个轻量虚拟机沙箱环境中,拥有独立的内核,具备更好的安全隔离能力。适用于不可信应用隔离、故障隔离、性能隔离、多用户间负载隔离等场景。

  • 机密计算:基于Intel SGX提供的可信应用或用于交付和管理机密计算应用的云原生一站式机密计算平台,帮助您保护数据使用中的安全性、完整性和机密性。机密计算可以让您把重要的数据和代码放在一个特殊的可信执行加密环境。

异构资源

  • GPU:支持创建以GPU实例作为工作节点的集群,并支持GPU调度、GPU监控、GPU弹性伸缩、GPU运维管理等。更多信息,请参见创建GPU集群

  • 共享GPU:支持在云平台和自己的数据中心的集群中通过GPU共享调度框架实现多个容器运行在同一个GPU设备。更多信息,请参见共享GPU调度概述

  • 云原生AI:提供了云原生AI能力,支持编排、管理数据计算类任务。更多信息,请参见云原生AI套件概述

开发者工具