阿里云容器服务灵骏版是容器服务 Kubernetes 版针对智能计算灵骏提供的集群类型,提供全托管和高可用控制面的标准Kubernetes集群服务,支持以灵骏计算节点作为Kubernetes集群的工作节点。本文介绍阿里云ACK灵骏托管版集群的产品简介、功能介绍和核心优势等。
索引
使用说明
如需使用ACK灵骏托管版集群,请先前往智能计算灵骏控制台,创建带有ACK的灵骏集群服务。更多信息,请参见创建带有ACK的灵骏集群服务。
关于ACK灵骏托管版集群的更多操作以及更多功能的使用,请参见:
产品简介
ACK灵骏托管版集群提供了全托管和高可用控制面的标准Kubernetes集群服务,支持高效管理异构资源、调度异构任务,作为支撑人工智能平台PAI的云原生底座,并提供AI、HPC等高性能计算场景下的云原生增强能力。下图展示了ACK灵骏托管版集群的产品架构,并体现出在整个软硬分层、统一优化的集成产品方案中,ACK灵骏托管版集群提供了稳定、可靠、高效、安全的云原生AI基础设施服务。关于灵骏,请参见什么是灵骏。
功能介绍
集群管理
ACK灵骏托管版集群的核心管理能力与ACK Pro托管版集群一致。集群控制面由ACK创建并托管,管控节点默认为3个可用区的高可用部署。提供集群的生命周期管理,以及集群授权、集群监控、集群升级、组件管理等集群运维操作。
节点管理
ACK灵骏托管版集群为灵骏计算节点提供灵骏节点池类型,支持节点池生命周期管理以及节点批量添加和移除,提供与ECS节点池一致的管理和运维,包括节点配置、节点运维、节点托管、调度应用至指定节点池等,以及监控诊断和自动化运维等能力。
云原生AI
ACK灵骏托管版集群默认提供云原生AI增强组件,支持多GPU卡的拓扑感知调度,结合GPU容器虚拟化方案eGPU提供共享GPU调度和隔离;针对AI、HPC等任务特点,支持Gang、Capacity、Binpack等任务调度策略;还支持数据集编排和访问加速。
核心优势
安全稳定
ACK灵骏托管版集群具备ACK Pro托管版集群的企业级特性,提供控制面托管和高可用,免去了繁琐的集群搭建和配置工作;保障集群的稳定性、可靠性、安全性,支持赔付标准的SLA,满足企业级大规模生产环境的业务需求。
简化运维
ACK灵骏托管版集群提供标准的Kubernetes服务,并与智能计算灵骏以及其他相关云产品进行深度集成。为集群和灵骏计算节点提供了简单的操作和自动化的运维,保持与ECS节点一致的管理体验,减少了大量的适配和运维成本。
提效加速
ACK灵骏托管版集群提供GPU的共享调度和拓扑感知调度等能力,优化异构资源的使用效率和性能;为AI、HPC等任务提供了丰富的调度策略、任务优先级队列,优化AI训练和推理任务效率,统一AI资源和负载的标准化管理和交付。