分布式云容器平台ACK One概述

分布式云容器平台ACK One(Distributed Cloud Container Platform for Kubernetes)是阿里云面向混合云、多集群、分布式计算、容灾等场景推出的企业级云原生平台。ACK One可以连接并管理您任何地域、任何基础设施上的Kubernetes集群,并提供一致的管理和社区兼容的API,支持对计算、网络、存储、安全、监控、日志、作业、应用、流量等进行统一运维管控。本文介绍ACK One的产品优势、功能和应用场景。

image

ACK One控制台操作入口

ACK One控制台

产品优势

  • 提供一致界面和API,对集群、计算、网络、存储、安全、监控、日志、作业、应用、流量等提供企业级运维管控能力。

  • 面向云突发的业务波峰,业务自动或定时触发弹性扩容和缩容云上资源,降低综合业务成本。

  • 开箱即用的备份中心,提供应用和数据保护,并支持跨地域完整应用和数据一体迁移,以及应用多活部署的快速实施。

  • 提供了全域的应用分发、任务分发、流量治理能力,帮助企业客户基于自己的业务分布和数据管控诉求,全面构建安全、标准、现代化的云原生IT架构。

  • 一键部署经云端大规模验证的企业级产品、组件到任意Kubernetes集群,从而获得增强的安全、调度、AI大数据加速器能力。

产品功能

为了应对分布式云场景多种挑战,ACK One提供以下功能。

注册集群

image

通过ACK One注册集群,您可以将来自不同供应商和不同位置的K8s集群统一接入到阿里云容器服务ACK控制台,实现多个集群统一管理,并使用容器服务ACK丰富的集群扩展能力,同时获得云上弹性计算资源。

  • 云上云下一致的运维体验:与阿里云容器服务ACK集群一样,可以在本地数据中心K8s集群和其他云服务的K8s集群中使用以下能力。

    • 可观察性:集群控制面监控,集群数据面监控,应用实时监控,日志收集与查询,成本分析FinOps。

    • 安全合规:认证授权,集群审计,策略管理,配置巡检。

    • 备份恢复:提供云上备份、恢复、迁移一体化的方案,支持数据和应用的云容灾。

    • 微服务治理:支持通过阿里云服务网格ASM或者微服务引擎MSE管理K8s集群中的微服务。

  • 云上弹性:可以将阿里云ECS节点和弹性容器实例ECI加入到本地K8s集群中,由本地K8s集群调度云上计算资源,应对IDC资源不足和突发业务流量。

  • 智能调度

    • 利用容器服务ACK调度器,实现Gang Scheduling、CPU拓扑感知、ECI弹性调度等高阶调度能力。

    • 利用分布式缓存ACK Fluid应对存算分离场景,提升访问效率和减少带宽占用。

注册集群相关文档,请参见注册集群概述

多集群舰队

image

当您同时运行多个K8s集群时,可以通过多集群舰队ACK One Fleet,关联多个集群,并通过多集群舰队提供的统一控制面,同时管理多个关联集群。

  • 多集群舰队控制面基于K8s控制面构建,提供标准Kubernetes API。

  • 多集群舰队可以接入多个K8s集群,非容器服务ACK集群,可以先通过注册集群接入。

  • GitOps应用分发:托管开源ArgoCD,实现GitOps多集群应用分发。

  • 流量管理:集成MSE云原生网关,实现多集群应用南北流量控制;支持多集群Service,实现多集群东西流量控制。

  • 作业分发:离线作业多集群调度,选择适合的集群运行离线作业。

  • 全局监控:多集群监控大盘,一个监控大盘查看所有集群的监控指标。

多集群舰队相关文档,请参见多集群舰队概述

分布式工作流Argo集群

image

分布式工作流Argo集群采用无服务器模式,使用阿里云弹性容器实例ECI运行离线工作流。

  • 成本优化:控制面免费,数据面按使用计费,Spot优化成本。

  • 高IO带宽:通过分布式数据缓存,提供20+ GB/s聚合读带宽,支持跨地域访问。

  • 资源预测:通过负载感知自动调整资源规格。

  • 规模化计算:支持千级并发工作流,数万计算任务。

  • 事件驱动:支持Git、阿里云MNS、OSS等事件源触发工作流自动运行。

分布式工作流Argo集群相关文档,请参见分布式工作流Argo集群概述

应用场景

场景1:注册集群,接入云端构建混合云

image

场景描述

  • 云下IDC自建集群:打通集群网络,实现云下云上资源共享。

  • 按需在云上伸缩计算资源和应用:业务高峰期,在云端快速扩容,把部分业务流量引到云端。

场景2:注册集群,云下K8s集群使用云产品扩展集群能力,云上云下集群一致运维体验

image

场景描述

  • 一致运维体验:ACK统一的运维能力下沉到数据中心集群和第三方公有云集群。

  • 增强可观测性:支持日志、监控、和事件收集,享受云上同等的运维体验。

  • 安全能力提升:一键开启审计、安全巡检、节点风险探测,策略治理。

  • 微服务治理:阿里云微服务引擎MSE与服务网格ASM提供微服务治理能力。

场景3:注册集群 ,备份容灾、混合云、同地域、跨地域数据容灾

image

场景描述

  • 应用上云:提供跨地域和数据中心的应用一致性备份和秒级恢复,帮助您的业务应用快速上云。

  • 数据灾备:提供跨地域和数据中心的有状态应用备份,支持备份策略和恢复策略。持续容灾备份到云端,提高勒索防护的防范能力。

  • 业务容灾:提供跨地域和数据中心的应用和数据异地备份容灾和定时备份能力。

  • 异地多活:提供兼容Kubernetes,快速构建两地三中心容灾系统,帮助您搭建高可用系统。

场景4:注册集群,协同调度器赋能AI和大数据

image

场景描述

  • AI算法开发:提供全面的任务、配额、可观测性管理。

  • AI训练:支持拓扑感知和丰富的任务调度策略,提升训练效率。通过存算分离架构,大幅提升分布式数据训练速度。支持跨集群作业任务调度,提供面向多集群优化的TensorFlow、Spark、CronJob等作业任务分发和调度。

  • AI推理:提供GPU共享,资源利用率可提高约300%。支持异构资源弹性伸缩,提供云上云下统一的弹性调度管理。

  • CPU智能调度:针对裸机的智能CPU调度和NUMA感知。

场景5:多集群舰队,多集群GitOps应用分发

image

场景描述

  • 高可靠性:Git仓库作为应用部署的唯一来源,可提供版本控制、变更审批流程、代码回滚和审计能力。

  • 高安全性:开发者无需任何Kubernetes集群权限,仅需要Git仓库权限。

  • 应用持续部署:Git仓库中应用状态与Kubernetes集群应用状态自动同步。

  • 应用多集群分发:支持将应用同时发布到多个集群,并支持差异化配置。

场景6:多集群舰队,多集群网关实现应用同城容灾

image

场景描述

  • 多集群网关:多集群南北流量管理,简化管控成本。

  • 全局Ingress:使用Ingress规则控制七层流量,实现基于权重、副本数、自动fallback等策略。

场景7:分布式工作流Argo集群,通用离线任务与复杂工作流编排与调度

image

场景描述

  • 托管Serverless Argo控制面:完全兼容开源Argo Workflow编排标准。

  • 多地域多可用区:保证资源供给,并结合Spot降低成本。

  • 分布式数据缓存:应对存算分离挑战,提高数据访问效率,降低计算成本。

  • 业务场景:仿真计算、科学计算、数据处理、持续集成。

联系我们

如果您对于ACK One有任何疑问,欢迎使用钉钉搜索钉钉群号35688562加入钉钉群。