ACK One多集群全局监控基于单集群Prometheus的监控指标,聚合汇总多个集群的监控指标,并提供多集群全局的监控大盘,让您可以在一个监控大盘上获取多个集群的监控指标。本文介绍如何开启多集群全局监控并查看全局监控信息。

前提条件

背景信息

随着业务的开展,企业需要构建多个Kubernetes集群来满足隔离、高可用、容灾等需求,但现有的监控系统往往针对单个Kubernetes集群,在日常的多集群运维中,需要频繁切换监控大盘才能获取所有集群的监控指标,在问题诊断中需要手工对比对各集群监控指标的差异。ACK One全局监控提供多集群全局的监控大盘,可帮您解决这些问题。

核心概念

  • 聚合实例:聚合多个集群Prometheus监控指标,提供多集群全局的监控大盘。
  • 关联集群:阿里云账号下所有的关联集群,都可以添加到聚合实例中或从聚合实例中移除。关联集群添加到聚合实例的前提是已安装Prometheus监控。

操作步骤

  1. 登录ACK One控制台,在左侧导航栏中,选择分布式云基础架构 > 多集群全局监控
  2. 多集群全局监控页面,打开聚合实例下的开关开启聚合实例。
    说明 仅首次登录使用需要开启。
    on1
  3. 检查子集群区域,确认待关联集群的Prometheus安装情况,然后将关联集群加入聚合实例中。
    • 若关联集群显示已安装,单击对应关联集群右侧操作列下的加入聚合
    • 若关联集群显示未安装,单击对应关联集群右侧操作列下的前往安装,跳转到容器服务管理控制台Prometheus监控页面,然后单击安装组件下面的开始安装。安装完成后,返回聚合实例页面进行刷新,然后单击右侧操作列下的加入聚合
    说明 您也可以通过批量加入功能将多个待关联的集群同时添加到聚合实例中。
    聚合
    关联集群加入聚合实例后,对应的加入聚合实例下方状态显示为已加入
  4. 聚合实例开启页面下方单击查看监控大盘,查看如下所示的所有已加入聚合实例的关联集群的监控指标。
    说明 在聚合实例监控详情页面,单击页面右上方的实例设置,可返回到聚合实例开启页面,将待新增的关联集群加入到聚合实例中。
    ps