acs-virtual-node

ACS Virtual Node实现了Kubernetes与容器计算服务ACS容器算力的无缝连接。本文介绍ACS Virtual Node的组件信息、使用说明和变更记录。

组件介绍

ACS Virtual Node是基于社区开源项目Virtual Kubelet,扩展了对Provider的支持,并做了大量优化,实现Kubernetes与容器计算服务ACS容器算力的无缝连接。Kubernetes集群可以轻松获得极大的弹性能力,而不必受限于集群的节点计算容量。您可以灵活地按需创建ACS Pod,无需自行规划集群容量。

ACS Virtual Node将应用PodServerless容器方式运行,提供弹性、免容量规划、按需使用、按需计费的能力。在Job类任务、CI/CD、Spark大数据计算、在线应用弹性等场景中可以显著提升应用部署的弹性效率,以及降低应用的计算成本。

使用说明

关于ACS Pod功能的更多信息,请参见ACS Pod实例概述

变更记录

202511

版本号

变更时间

变更内容

变更影响

v2.15.6

20251105

  • 优化:

    • 优化 ACS 实例资源的规整逻辑。

    • 优化当预留节点上的 Pod 使用了不支持的 ComputeClass 时的错误提示信息。

  • 缺陷修复:

    • 修复本地 Informer 缓存可能未及时过期的问题。

    • 修复了 Pod 进行原地资源变更(InPlace VPA)后,其 Annotation 与 Spec 中定义可能不一致的问题。

此次升级不会对业务产生影响。

202510

版本号

变更时间

变更内容

变更影响

v2.15.5

20251020

  • 缺陷修复:

    • 修复ACS算力使用PodNetworking的问题。

    • 修复ACS集群预留节点IP地址缺失的问题。

此次升级不会对业务产生影响。

202509

版本号

变更时间

变更内容

变更影响

v2.15.4

20250928

  • 优化:

    • 优化了 DaemonSet Pod 调度至虚拟节点时的错误提示。

    • 提升了ACS集群中GPU Pod从异常状态恢复的效率。

  • 缺陷修复:

    • 修复ACS Pod偶现的状态不更新问题。

    • 修复ACS集群预留节点IP地址缺失问题。

    • 修复使用CNFS存储卷偶现奔溃问题。

此次升级不会对业务产生影响。

v2.15.3

20250928

  • 缺陷修复:

    • 修复极端场景下Pod长时间处于 Pending 状态的问题。

    • 修复极端场景下Pod无法进入终态(如 Succeeded/Failed)问题。

此次升级不会对业务产生影响。

v2.15.2

20250922

  • 缺陷修复:

    • 修复v2.15.0版本中ACS资源规整不生效的问题。

    • 修复预留节点KubeletVersion字段不准确的问题。

    • 修复因 API Server 推送延迟导致的本地缓存数据过期问题。

此次升级不会对业务产生影响。

v2.15.1

20250909

  • 缺陷修复:修复通过Annotation指定vSwitchPod创建失败的问题。

此次升级不会对业务产生影响。

20258

版本号

变更时间

变更内容

变更影响

v2.15.0

20250819

  • 新功能:

    • 支持预留节点功能。

    • 支持 ECI 到 ACS 协议的自动转换。

  • 优化:

    • 降低程序内存占用(约 40%)。

    • 提升 ACS Pod 的创建成功率。

    • 调整虚拟节点的临时存储容量(ephemeral-storage)至 60000 Ti,以防止调度失败。

  • 缺陷修复:

    • 修复 ACS GPU Pod 挂载云盘后扩容失败的问题。

    • 修复容器原地重启失败的问题。

    • 修复在 ACK 集群中 PodNetworking 配置不生效的问题。

此次升级不会对业务造成影响。

v2.12.0-acs.16

202587

  1. 修复异常情况下偶现的Pod一直Pending的问题。

  2. 支持预留节点状态上报。

  3. 优化Interruption.GPUShareReclaim Condition上报。

此次升级不会对业务造成影响。

20255

版本号

变更时间

变更内容

变更影响

v2.12.0-acs.14

2025512

  1. 修正预留节点的非预期更新行为。

  2. 修复因acs-profile配置格式非法而导致的解析异常问题。

  3. 支持透出Interruption.GPUShareReclaim Condition。

此次升级不会对业务造成影响。

20253

版本号

变更时间

变更内容

变更影响

v2.12.0-acs.13

2025320

  1. 支持GPU类型Pod的库存感知调度能力。

此次升级不会对业务造成影响。

20252

版本号

变更时间

变更内容

变更影响

v2.12.0-acs.12

2025213

  1. 调整虚拟节点上临时存储容量值为60000 TiB。

  2. 修正高级调度场景遇到ServiceUnavailable时未进行重试的问题。

  3. 优化PVC使用延迟绑定模式场景下与csiprovisioner组件的联动。

此次升级不会对业务造成影响。

20251

版本号

变更时间

变更内容

变更影响

v2.12.0-acs.11

2025121

优化高级调度能力。

此次升级不会对业务造成影响。

v2.12.0-acs.10

2025117

  • 支持暴露预留节点的指标信息。

  • 优化重试机制。

  • 其他功能优化。

此次升级不会对业务造成影响。

202411

版本号

变更时间

变更内容

变更影响

v2.12.0-acs.9

20241127

  • 支持GPU类型Pod扩容云盘。

  • 支持通用型和性能型Pod感知库存。

  • 其他功能优化。

此次升级不会对业务造成影响。

202409

版本号

变更时间

变更内容

变更影响

v2.12.0-acs.8

20240913

  • 升级依赖的K8s API版本到1.30。

  • 新增Prometheus指标container_socketscontainer_processes。

  • 支持KubeSkoop进行网络指标数据采集。

  • 支持GPU类型Pod挂载云盘。

  • 支持通用型Pod CPU热变配。

此次升级不会对业务造成影响。

202408

版本号

变更时间

变更内容

变更影响

v2.12.0-acs.7

20240821

修复关联Event没有UID的问题。

此次升级不会对业务造成影响。

v2.12.0-acs.6

20240802

通用型和性能型Pod支持扩容云盘类型的存储卷。

此次升级不会对业务造成影响。

202407

版本号

变更时间

变更内容

变更影响

v2.12.0-acs.5

20240725

通过Pod身份认证方式替代Role+RoleBinding认证方式。

此次升级不会对业务造成影响。

202406

版本号

变更时间

变更内容

变更影响

v2.12.0-acs.4

20240621

  • 与调度器协作以支持Kubernetes原生调度语义。

  • 支持使用容量预留的资源创建Pod。

此次升级不会对业务造成影响。