容器服务ACK 2024年功能发布记录

本文介绍容器服务 Kubernetes 版 ACK(Container Service for Kubernetes)的最新动态。

背景信息

  • 关于容器服务 Kubernetes 版 ACK(Container Service for Kubernetes)支持的Kubernetes(K8s)版本,请参见Kubernetes版本概览及机制

  • 容器服务 Kubernetes 版 ACK(Container Service for Kubernetes)支持的操作系统包括ContainerOS、Alibaba Cloud Linux 3、Alibaba Cloud Linux 3 Arm版、Alibaba Cloud Linux UEFI 3、Windows、Red Hat、Ubuntu等。更多信息,请参见操作系统

2024年10月

产品

功能名称

功能描述

发布地域

相关文档

容器服务 Kubernetes 版

CCM组件发布v2.10.0版本

CCM组件发布v2.10.0版本,支持readinessGate能力、支持实例创建后通过Annotation service.beta.kubernetes.io/alibaba-cloud-loadbalancer-additional-resource-tags修改标签等功能。

全部

Cloud Controller Manager

使用ECI弹性资源运行Spark作业

新增实践介绍如何在ACK集群中使用弹性容器实例ECI运行Spark作业。通过使用ECI弹性资源并配置合适的调度策略,您可以按需创建ECI Pod,并按资源使用量按需付费,从而有效减少资源闲置带来的成本浪费,进而更加经济高效地运行Spark作业。

全部

使用ECI弹性资源运行Spark作业

容器服务 Serverless 版

托管CoreDNS支持自定义参数配置

当您的集群运行托管CoreDNS时,您可以通过CustomDNSConfig自定义资源配置CoreDNS的解析行为。

全部

托管CoreDNS支持自定义参数配置

分布式云容器平台 ACK One

自建Kubernetes集群接入云上Serverless算力

通过ACK Virtual Node,您可以在自建Kubernetes集群创建Serverless Pod,使用云上计算资源(CPU和GPU)的弹性算力。

全部

自建Kubernetes集群通过ACK Virtual Node接入云上Serverless算力

支持ALB多集群网关

ACK One ALB多集群网关是ALB Ingress的多集群模式,其使用方式与ALB Ingress的单集群模式基本相似,但也存在一些差异。

全部

ALB多集群网关概述

云原生AI套件

借助TensorRT优化模型推理性能

TensorRT优化模型过程中,首先将PyTorch(或TensorFlow)等训练框架训练完成后的模型编译为TensorRT的格式,然后利用TensorRT推理引擎运行这个模型,从而提升这个模型在英伟达GPU上运行的速度。

全部

借助TensorRT优化模型推理性能

容器服务 Edge 版

支持RRSA功能

基于适用于服务账户的RAM角色(RAM Roles for Service Accounts,简称RRSA)功能,您可以在集群内实现Pod维度的OpenAPI权限隔离,从而实现云资源访问权限的细粒度隔离,降低安全风险。

全部

通过RRSA配置ServiceAccount的RAM权限实现Pod权限隔离

支持托管节点池

如果您希望将节点进行分组纳管,同时降低节点的运维负担,例如操作系统(OS)CVE漏洞自动修复、kubelet自动升级、节点故障时重启节点等,您可以启用托管节点池。托管节点池是ACK推出的自动化运维型节点池,在普通节点池的基础上支持多种自定义运维能力。

全部

托管节点池概述

支持报警配置

报警配置功能提供统一管理容器报警场景的功能,包括容器服务异常事件报警、集群相关基础资源的关键指标报警、集群核心组件及集群中应用的指标报警。

全部

发布Kubernetes 1.28版本

如需将1.26升级为1.28版本,请提交工单联系容器服务团队。其余版本暂不支持升级。

全部

升级集群

容器服务灵骏版

网络拓扑感知调度

支持在ACK灵骏集群中通过网络拓扑感知调度将Pod声明调度到相同的一层转发域或二层转发域下,以此减少机器间的网络通信时延,进而缩短作业完成时间。

全部

使用网络拓扑感知调度

2024年09月

产品

功能名称

功能描述

发布地域

相关文档

容器服务 Kubernetes 版

发布Kubernetes 1.31版本

ACK现已支持Kubernetes 1.31版本。您可在创建集群时直接创建1. 31版本的集群,也可将低版本集群升级至1.31 版本。

全部

Kubernetes 1.31

支持为命名空间或Service开启删除保护

启用安全策略管理功能后,您可以为涉及关键业务、敏感数据的命名空间或Service开启删除保护功能,以避免误删除带来的维护成本。

全部

相关操作:为命名空间或Service开启删除保护

支持Nginx Ingress Controller组件的链路追踪

ACK支持将集群Nginx Ingress Controller组件的链路信息上报至可观测链路 OpenTelemetry 版,对链路信息进行实时聚合计算和持久化,形成链路明细、实时拓扑等监控数据,以便进行组件问题的排查与诊断。

全部

实现Nginx Ingress Controller组件的链路追踪

支持为Knative服务开启成本洞察

成本洞察功能可以协助企业IT成本管理人员从多维度了解集群资源使用量及成本分布,提供成本节约建议。您可以为Knative服务开启成本洞察,查看Knative服务实时估算的成本。

全部

启用Knative服务成本洞察

通过成本洞察识别集群资源风险

为了快速识别集群工作负载的稳定性、性能或成本风险,您可以通过为集群开启成本洞察功能来查看集群工作负载的资源水位、查看集群Burstable Pod的资源配置情况,以及查看集群存在风险的BestEffort Pod,从而实现工作负载的稳定性和性能分析。

全部

使用成本洞察识别集群资源风险

使用Spark Operator运行Spark作业

本实践介绍如何在ACK集群中使用Spark Operator运行Spark作业,帮助数据工程师快速高效地运行和管理大数据处理作业。

全部

使用Spark Operator运行Spark作业

分布式云容器平台 ACK One

支持配置 ArgoCD告警

ACK One的舰队监控基于可观测监控Prometheus版的监控指标,提供了舰队自身的监控大盘,您可以根据自身需求自定义告警规则,实时监控相关指标。

全部

配置ACK One ArgoCD告警

支持应用分发能力

您可以通过ACK One舰队的应用分发功能将舰队实例中的应用分发至多个关联集群中。通过在舰队实例中定义分发策略,精准选择出符合条件的Kubernetes资源,并将其分发至策略指定的多个目标集群中。您还可以定义差异化策略来选择需要差异化部署的集群以及应用。相比于GitOps方式,它无需依赖Git仓库。

全部

应用分发概述

支持配置访问PrivateZone服务

PrivateZone是基于阿里云专有网络VPC环境的私有DNS域名解析和管理服务。边界路由器VBR实例、IPsec连接、云连接网CCN实例连接至转发路由器后,其关联的本地网络可以通过转发路由器访问PrivateZone服务,实现DNS域名解析。

全部

配置访问PrivateZone服务

注册集群支持挂载NAS静态存储卷

NAS存储卷是一种可共享访问、弹性扩展、高可靠以及高性能的分布式文件系统。您可以在注册集群中使用阿里云NAS静态存储卷,并实现持久化存储与共享存储。

全部

使用NAS静态存储卷

云原生AI套件

支持使用FUSE挂载点自愈功能

在应用Pod的生命周期内,FUSE守护进程可能会因为异常情况崩溃,导致应用Pod无法正常访问数据。开启并使用FUSE挂载点自愈功能后,应用Pod可以在不重启的前提下恢复应用的数据访问。

全部

使用FUSE挂载点自愈功能

支持跨命名空间共享数据集

Fluid实现了跨命名空间的数据访问及缓存资源共享,这意味着公开数据集能够在多个团队间复用,实现了单次缓存、多团队共享的高效模式,增强了数据的利用效率与管理的灵活性,为研发团队间的协同作业提供了便利。

全部

跨命名空间共享Dataset

容器服务 Edge 版

支持ENS管理

ACK Edge集群提供了ENS的容器托管能力。您可以将分布于多个地域和多个运营商的ENS实例进行统一容器化管理,通过ENS云盘、ENS边缘负载均衡等能力提供云原生的存储、网络能力。

全部

ENS管理概述

支持节点池服务拓扑管理

原生Kubernetes Service的后端端点扁平分布在集群中任意节点。因此,跨越不同分组节点的Service流量,会大概率出现访问不可达、或者访问效率低下的问题。Service流量拓扑支持边缘节点应用只能由相同节点池的节点访问,或者只能由本节点访问。

全部

节点池服务拓扑管理

2024年08月

产品

功能名称

功能描述

发布地域

相关文档

容器服务 Kubernetes 版

节点即时弹性支持实例规格库存健康状况的监控

节点即时弹性功能支持根据ECS实例的库存情况来动态选择规格和可用区。如需感知并监控实例规格库存健康状况,获取节点池的实例配置优化建议,您可以查看节点池库存健康度的ConfigMap,评估当前节点池库存是否健康,提前对实例规格配置进行分析和调整。

全部

查看节点即时弹性健康度

集群自动升级支持选择更多升级频次

自动升级集群Kubernetes版本时,支持配置升级频次为最新补丁版本(Patch)、次新次要版本(Stable)、最新次要版本(Rapid)。

全部

自动升级集群

基于MPS实现GPU共享调度和显存隔离

您可以使用MPS(Multi-Process Service)管理来自多个NVIDIA GPU上运行的CUDA应用或MPI进程的请求,实现GPU资源的共享。您可以在容器服务管理控制台为节点池配置对应标签,基于MPS模式实现GPU的共享调度和AI应用的显存隔离。

全部

使用MPS实现GPU共享调度和显存隔离

Knative发布v1.12.5版本

Knative发布v1.12.5-aliyun.7版本,适配Kourier 1.12版本,新增支持容器镜像服务ACR企业版、ECS抢占式实例(Spot实例)大盘等多项能力。

全部

Knative版本发布说明

分布式云容器平台 ACK One

支持多集群应用管理能力

多集群应用控制台可以简化多集群应用编排(ArgoCD ApplicationSet),支持基于单一应用编排并根据您的编排内容自动生成一个或多个应用。

全部

创建多集群应用

支持通过自定义镜像的方式为注册集群构建弹性节点池

为了缩短云上节点从启动状态到Ready状态的时间,您可以通过使用自定义镜像预先安装所需的软件包,以减少软件包下载的时间,提升系统启动的效率。

全部

使用自定义镜像方式构建弹性节点池

使用PythonSDK构建大规模Argo Workflows

新增最佳实践,介绍如何使用Python SDK构建大规模Argo Workflows。Hera Python SDK提供了一种简洁易用的替代方案,支持以Python代码构建工作流,支持复杂任务,易于测试,并与Python生态无缝集成,降低了工作流设计的门槛。

全部

使用Python SDK构建大规模Argo Workflows

基于EventBridge的事件驱动CI Pipeline

新增最佳实践,介绍如何构建基于事件驱动的自动化CI Pipeline流程。基于事件总线EventBridge和分布式工作流Argo Workflows可以构建高效、快速、低成本的事件驱动自动化CI Pipeline,简化并加速应用交付过程。

全部

基于EventBridge的事件驱动CI Pipeline

云原生AI套件

使用Dify快速构建AI问答助手

使用Dify服务可以将企业或个人的知识库集成到大模型应用中,从而创建出深度定制化的AI问答解决方案,并可将其集成到业务场景中,提升日常研发管理效能。

全部

基于Dify构建网页定制化AI问答助手

安装和管理Flowise组件

介绍在ACK集群中部署和管理Flowise应用以及常见问题的解决方案。开发LLM应用通常需要经历多次迭代。Flowise可以通过低代码和拖拽式UI等方式实现快速迭代,更快地从测试环境过渡到生产环境。

全部

安装flowise组件

使用TensorRT-LLM部署Qwen2模型推理服务

以Qwen2-1.5B-Instruct模型、GPU类型为A10卡为例,介绍如何在ACK中使用Triton推理服务 + TensorRT-LLM部署通义千问模型推理服务。模型部署过程中使用Fluid Dataflow完成模型准备工作,并使用Fluid提升模型加载速度。

全部

使用TensorRT-LLM部署Qwen2模型推理服务

容器服务 Edge 版

支持云原生AI套件

ACK Edge集群中支持部署云原生AI套件云原生AI套件提供了简单的运维大盘和开发控制台,满足快速浏览集群状态、提交训练任务的需要。

全部

部署AI套件控制台

2024年07月

产品

功能名称

功能描述

发布地域

相关文档

容器服务 Kubernetes 版

Nginx Ingress Controller支持OpenTelemetry链路追踪

Nginx Ingress Controller发布v1.10.2-aliyun.1版本,支持通过OpenTelemetry的方式进行链路追踪。

全部

实现Nginx Ingress Controller组件的链路追踪

Poseidon支持集群维度网络策略GlobalNetworkPolicy

ACK集群中负责NetworkPolicy的组件Poseidon发布v0.5.0版本,支持GlobalNetworkPolicy,在Network Policy基础上增加了集群全局维度的网络策略功能,实现跨命名空间的网络策略管理。

全部

使用ACK GlobalNetworkPolicy

ContainerOS 发布3.3版本

ContainerOS是为容器场景垂直优化的阿里云官方操作系统,提供更高的安全性、更快的启动速度和极为精简的系统服务与软件包。ContainerOS 3.3版本更新内核版本至5.10.134-17.0.2.lifsea8,默认采用cgroup v2实现容器资源隔离,新增安全漏洞修复、缺陷修复等。

全部

ContainerOS镜像发布记录

节点池支持自定义Worker RAM角色

ACK托管集群默认会创建一个所有节点共享的默认Worker RAM角色。当您通过Worker RAM角色为特定的应用授权时,权限将会共享给集群内所有的节点,可能会存在非预期的权限扩散的风险。您可以在创建节点池时为其指定一个自定义的Worker RAM角色,通过为不同的节点池分配特定的角色,降低在集群所有节点中共用一个Worker RAM角色可能存在的风险。

全部

使用自定义Worker RAM角色

容器安全策略规则库新增策略

新增ACKBlockVolumeTypes策略,限制在集群指定范围内部署的Pod禁止使用的Volume挂载类型。

全部

ACKBlockVolumeTypes

支持新版本的NVIDIA GPU驱动

支持NVIDIA新版本的GPU驱动,版本号为550.90.07。

全部

ACK支持的NVIDIA驱动版本列表

使用LMDeploy部署Qwen模型推理服务的最佳实践

本最佳实践以模型为Qwen1.5-4B-Chat、GPU类型为A10卡为例,展示如何在ACK集群中使用LMDeploy框架部署通义千问(Qwen)模型推理服务。

全部

使用LMDeploy部署Qwen模型推理服务

使用KServe部署GPU共享的模型推理服务最佳实践

在某些场景下,您可能需要将多个模型推理任务共享在同一块GPU以提高GPU的利用率。本最佳实践以模型类型为Qwen1.5-0.5B-Chat、GPU类型为V100卡为例,演示如何使用KServe部署GPU共享的模型推理服务。

全部

部署GPU共享推理服务

分布式云容器平台 ACK One

基于EventBridage构建自动化CI Pipeline的最佳实践

您可以基于事件总线EventBridge和分布式工作流Argo Workflows,构建高效、快速、低成本的事件驱动自动化CI Pipeline,大幅简化和加速应用交付过程。

全部

基于EventBridge的事件驱动CI Pipeline

多集群GitOps应用

您可以通过控制台进行多集群应用编排,通过GitOps将Git repositories作为应用来源,对多种编排方式(YAML Manifests目录、Helm Charts、Kustomize等)的应用实现版本管理、多集群分发和持续部署等能力。

全部

使用ApplicationSet创建多个应用

注册集群支持使用自定义镜像的弹性节点池

为了缩短云上节点从启动状态到Ready状态的时间,您可以通过使用自定义镜像预先安装所需的软件包的方式,显著减少软件包下载的时间,提升系统启动的效率。

全部

使用自定义镜像方式构建弹性节点池

云原生AI套件

Fluid新增FUSE挂载点自愈的能力

Fluid支持对FUSE挂载点的轮询检查和周期性自动修复能力,以提升业务数据访问的稳定性。

全部

容器服务 Edge 版

支持Kubernetes 1.28版本

ACK Edge集群支持创建1.28.9-aliyun.1版本。

全部

ACK Edge发布Kubernetes 1.28版本说明

支持存储CSI组件

本文介绍根据节点类型以及接入方式的不同,ACK Edge的存储插件可以支持的存储介质范围以及使用方法。

全部

存储概述

支持云原生AI套件功能

ACK Edge集群在云上环境支持云原生AI套件完整的产品能力,在云下环境中能力有所裁剪。不同节点和网络类型下所支持的能力和使用限制存在差异。

全部

云原生AI套件概述

新增使用Ingress的最佳实践

本文介绍了在边缘节点池中部署Ingress的注意事项,以及与在云端节点池中使用Ingress的差异。

全部

2024年06月

产品

功能名称

功能描述

发布地域

相关文档

容器服务 Kubernetes 版

发布Kubernetes 1.30版本

新增支持Kubernetes 1.30版本,您可在创建集群时直接创建1.30版本的集群,也可将低版本集群升级至1.30版本。

全部

节点池支持OS参数配置

当Linux系统的OS参数默认配置无法满足业务需求时,您可以在节点池维度自定义节点的OS参数配置,以优化系统性能。

全部

自定义节点池OS参数

支持Ubuntu操作系统

新增支持Ubuntu 22.04操作系统,面向1.30及以上版本的集群开放。

全部

操作系统

增强重调度功能

重调度是指将某个节点上调度不合理的Pod重新调度到另一个节点,适用于集群资源利用不均衡、节点负载过高或有新的调度策略需求等场景。为了丰富重调度策略,ACK ack-koordinator组件的Koordinator Descheduler模块在原能力基础上对重调度策略、Pod驱逐方式、驱逐流量控制等维度进行了增强。

全部

支持在控制台创建和管理NLB类型的Service

支持在容器服务管理控制台创建和管理NLB类型的Service。网络型负载均衡NLB是阿里云面向万物互联时代推出的新一代四层负载均衡,支持超高性能和自动弹性能力,单实例可以达到1亿并发连接。

全部

csi-provisioner组件发布新版本

存储csi-provisioner组件提供了数据卷的自动创建能力。该组件发布了新版本,新增支持csi-provisioner的托管版本(不占用您的集群节点资源)、在Alibaba Cloud Linux 3上通过TLS协议挂载NAS、兼容Ubuntu节点等特性。

全部

csi-provisioner

分布式云容器平台 ACK One

多集群舰队可观测能力升级

ACK One新增舰队监控,并进一步优化了关联子集群的全局监控能力,即新增舰队自身的监控大盘,包括核心组件、GitOps监控等。全局监控会聚合汇总多个集群的监控指标,并提供多集群的全局监控大盘(包括成本洞察等)。

全部

舰队监控

云原生AI套件

云原生AI套件全量免费

云原生AI套件由付费使用模式正式调整为全量免费。新老用户均可免费使用云原生AI套件的所有功能,在容器平台上快速定制化构建AI生产系统,并为AI/ML应用和系统提供全栈优化,充分体验云原生AI技术带来的便捷与高效,加速业务创新与智能化转型。

全部

【免费公告】云原生AI套件免费公告

容器服务 Edge 版

为云上节点池提供云盘存储能力

ACK Edge集群复用了ACK托管集群的CSI插件,ACK Edge集群中云上节点池的ECS实例使用的CSI插件和 ACK托管集群的能力完全保持一致。您可以通过PV、PVC的方式在云上节点池中使用云盘。

全部

存储概述

专线模式下支持对云下端点工作负载的网络访问

支持接入云下IDC服务设备以及边缘设备。专线模式下新增支持API Server访问边缘Pod或Service。该功能由边缘控制器组件(ECM)的模块提供。ECM负责管理云上VPC访问边缘Pod的路由自动化配置。

全部

网络管理概述

2024年05月

产品

功能名称

功能描述

发布地域

相关文档

容器服务 Kubernetes 版

cloud-controller-manager组件支持跨VPC挂载NLB等能力

cloud-controller-manager组件发布v2.9.1版本,新增跨VPC挂载NLB、NLB服务器组流量权重控制等能力,支持ECS和集群内容器混合挂载等场景,优化了NLB IPv6场景支持。

全部

Cloud Controller Manager

ALB Ingress支持自定义转发规则白屏化配置

创建ALB Ingress时支持白屏化创建自定义转发规则,支持根据路径、域名、请求头等转发条件对请求进行匹配,转发动作支持配置转发至特定服务和返回固定响应。

全部

自定义ALB Ingress的转发规则

使用NVMe云盘实现多重挂载及Reservation

支持在ACK集群中使用NVMe云盘多重挂载及Reservation功能。NVMe云盘支持多重挂载能力,最多可以同时挂载到16个实例上;同时也基于多重挂载实现了符合NVMe协议规范的Reservation功能。这些特性可以帮助数据库等应用在保持一致性的同时,实现更快的故障转移等功能。

全部

使用NVMe云盘多重挂载及Reservation

支持通过特性门控配置新版本ossfs

在1.30.1及以上版本的CSI组件中,您可以开启特性门控将ossfs切换至1.91及以上版本,以提升文件操作性能。如果您对文件操作性能有较高要求,推荐您将ossfs版本切换至1.91及以上版本。

全部

分布式云容器平台 ACK One

基于工作流集群构建Golang项目的CI Pipeline

ACK One工作流集群基于开源Argo Workflows项目构建,全托管Argo Workflows,具有极致弹性、自动扩展、零运维成本等优势,可以帮助您快速实现更简单、低成本、高效率的CI流水线。本实践为您介绍如何基于工作流集群构建Golang项目的CI Pipeline。

全部

基于工作流集群构建Golang项目的CI Pipeline

云原生AI套件

Fluid新增数据集动态挂载的能力

Fluid新增数据集动态挂载的能力,支持在容器内对所引用的PV、PVC对应的数据集挂载点做自动的更新和动态挂载操作。

全部

2024年04月

产品

功能名称

功能描述

发布地域

相关文档

容器服务 Kubernetes 版

ACK AI助手新增对ACK集群管控场景的异常诊断

支持对ACK集群管控场景的异常诊断,包括对集群内失败任务、错误日志和组件升级失败等相关场景的智能分析与诊断,降低集群的运维故障排查难度。

全部

使用ACK AI助手进行故障排查和智能问答

OSS支持使用RRSA配置OSS存储卷权限进行挂载。

基于适用于服务账户的RAM角色(RAM Roles for Service Accounts,简称RRSA)功能,支持在集群内实现PV维度的OpenAPI权限隔离,从而实现云资源访问权限的细粒度隔离,降低集群安全风险。

全部

通过RRSA鉴权方式挂载

ACK Extend Network Controller支持Pod挂载高防EIP

ACK Extend Network Controller发布v0.9.0版本,支持NAT网关、EIP等VPC网络资源的创建与管理,支持将原生高防EIP(原DDoS防护增强EIP)挂载到Pod,适用于将Pod直接暴露至公网时需要DDoS防护的场景。

全部

为Pod挂载独立公网EIP

策略治理内置规则库新增策略

策略治理内置规则库新增策略ACKServicesDeleteProtection、

ACKPVSizeConstraint、

ACKPVCConstraint。

全部

容器安全策略规则库说明

容器服务 Edge 版

提供边缘节点离线运维工具

在云边场景下,边缘节点通常会因为网络不稳定而处于离线状态,当节点离线后,则无法再对节点上的业务做运维操作,包括业务升级、配置变更等。ACK Edge集群提供边缘节点离线运维工具,用于支持在紧急情况下,对离线节点上的业务进行运维操作。

全部

边缘节点离线运维

分布式云容器平台 ACK One

支持多集群网关白屏化管理

ACK One通过托管MSE Ingress Controller,将MSE云原生网关作为多集群网关,提供拓扑可视化能力,并基于MSE Ingress提供多集群南北向流量的管理,从而快速实现同城应用多活容灾、流量多集群负载均衡、基于Header路由流量到指定集群等能力。

全部

管理网关

ACK One Argo Workflow集群优化OSS存储访问

ACK One Argo Workflow新增一系列重要增强功能,包括超大文件分片上传、Artifacts自动垃圾回收(GC)以及Artifacts高性能流式传输等,帮助您对OSS文件实现高效、安全的精细化管理。

全部

配置Artifacts

云原生AI套件

ACK集群支持一键部署MLflow

新增支持在ACK集群中一键部署MLflow,便于您追踪模型训练信息、管理和部署机器学习模型。同时,云原生AI套件支持对MLflow模型仓库中的模型进行全生命周期管理。

全部

2024年03月

产品

功能名称

功能描述

发布地域

相关文档

容器服务 Kubernetes 版

新增KubeConfig清除和回收站功能

支持阿里云账号或具有一定权限的RAM用户或角色查看和管理已下发的KubeConfig状态,针对部分有安全风险的KubeConfig进行清理和解除授权;同时,还可通过回收站恢复三十天内清除的KubeConfig。

全部

新增支持GPU设备隔离

在ACK集群的独占GPU调度场景下,为了应对GPU设备故障的情况,ACK提供一个机制,可以对GPU节点上的某个设备进行隔离,以避免新的GPU设备调度到此设备上。

全部

GPU Device-Plugin相关操作

新增采集指定虚拟节点的Metrics实践

存在多个虚拟节点的集群中,支持通过指定虚拟节点采集Metrics,减少单次采集的数据量。在大量使用虚拟节点容器的情况下,可以有效减少监控链路的压力。

全部

采集指定虚拟节点的Metrics

2024年02月

产品

功能名称

功能描述

发布地域

相关文档

容器服务 Kubernetes 版

ACK Virtual Node发布 v2.11.0版本

ACK Virtual Node v2.11.0支持创建Windows实例、原生调度语义支持Windows节点、支持启用ECI SysOM功能,即对内核等资源具备可观测性等新增能力并对ECI Pod创建过程中的证书生成效率等进行了优化。

全部

分布式云容器平台 ACK One

注册集群支持使用Knative功能

Knative是基于Kubernetes的Serverless框架,旨在制定云原生、跨平台的Serverless编排标准。它整合容器构建、工作负载管理和事件模型,帮助您部署和管理Serverless工作负载,打造企业级Serverless平台。

全部

Knative概述

支持基于ACK One构建混合云同城容灾系统

对于当前业务运行在IDC或第三方公共云的Kubernetes集群中的系统架构,如果希望通过云计算为云下业务提供同城灾备的高可用冗余能力,可利用阿里云分布式云容器平台 ACK One来提供统一的流量、应用和集群管理,实现业务流量的多集群路由和灾难情况下流量的自动平滑容灾。

ACK One通过托管MSE Ingress Controller,将MSE云原生网关作为多集群网关,以 Ingress API 来定义流量路由规则,支持多云、多集群、混合云场景的七层南北向流量管理能力。基于ACK One多集群网关构建的同城容灾系统,相较于传统基于DNS的方案,极大地降低了架构复杂度和使用成本、管理成本,支持毫秒级别的平滑迁移和七层路由能力。

全部

基于ACK One MSE多集群网关实现混合云容灾

增强AI场景支持,可使用Fluid加速OSS文件访问

Fluid是一个开源的Kubernetes原生的分布式数据集编排和加速引擎,主要服务于云原生场景下的数据密集型应用,例如大数据应用、AI应用等。注册集群支持使用Fluid加速OSS文件访问。

全部

使用Fluid加速OSS文件访问

GitOps支持钉钉机器人通知变更

在多集群的GitOps持续交付的场景中,在应用的高可用部署、系统组件多集群分发等基础功能之上,提升了通知服务的多样性,可使用钉钉机器人通知GitOps应用变更。

全部

使用钉钉机器人通知GitOps应用变更

云原生AI套件

提供Ray Cluster on ACK最佳实践

支持在ACK集群上快速创建Ray Cluster,与阿里云日志服务SLS、Prometheus监控、Redis等快速集成,增强日志管理、可观测、高可用等能力。同时,Ray autoscaler与ACK Autoscaler弹性功能的结合能更充分地发挥云的弹性能力,提高计算资源供给效率和性价比。

全部

Ray Cluster最佳实践

2024年01月

产品

功能名称

功能描述

发布地域

相关文档

容器服务 Kubernetes 版

上线容器服务ACK AI助手

容器服务ACK AI助手(后文简称“ACK AI助手”)是阿里云容器服务团队提供的基于大模型的新型助手功能。基于阿里云容器服务团队在Kubernetes和云原生领域积累的知识经验、阿里云容器服务运维体系的观测以及ACK技术专家的诊断经验,ACK AI助手为您提供阿里云容器服务和Kubernetes相关的、大模型增强的智能问答和智能诊断。

全部

使用ACK AI助手进行故障排查和智能问答

支持操作系统内核层的容器监控可观测能力

阿里云提供了链路追踪服务,为分布式应用的开发者提供了完整的调用链路还原、调用请求量统计、链路拓扑等,以快速分析和诊断分布式应用架构下的性能瓶颈,提高微服务时代下的开发诊断效率。您可以为集群安装ALB Ingress Controller组件并开启Xtrace功能,查看链路追踪数据。

全部

通过Albconfig开启Xtrace实现链路追踪

容器服务 Edge 版

发布Kubernetes 1.26版本

ACK Edge集群发布Kubernetes 1.26版本,对边缘节点自治、边缘节点接入等特性进行了优化或新增。

全部

ACK Edge发布Kubernetes 1.26版本说明

云边通信方案升级

从v1.26起,ACK Edge集群新增支持云边节点池维度的网络通信,相比于原有方案实现了高可用、弹性伸缩能力,提供云边容器级别监控运维。新方案中由Raven组件负责云边通信,可提供代理模式和隧道模式,分别提供跨网络域的主机网络HTTP通信和容器网络通信。

分布式云容器平台 ACK One

支持自定义域名访问GitOps控制台

如需使用自定义域名访问ACK One GitOps控制台,您可以将自定义域名通过CNAME记录指向GitOps的默认域名,配置SSL证书后,通过https://${your-domain}并使用云SSO账号登录。

全部

自定义域名访问GitOps控制台

新增基于Kubernetes容器集群的容灾架构与方案

本实践内容以Kubernetes集群(包括容器服务 Kubernetes 版的ACK集群、第三方云厂商集群和本地IDC集群)为基础,结合阿里云的网络、数据库、中间件及可观测相关云产品,为您介绍如何设计容灾架构和方案,帮助您构建一个更加有“韧性”的系统。

全部

基于Kubernetes容器集群的容灾架构与方案

更多信息

有关ACK的历史功能发布记录,请参见历史功能发布记录(2024年之前)