健康检查功能可以检查 ARMS Prometheus 监控是否安装成功。如果您发现 ARMS Prometheus 监控无法监控到数据,那么可以根据健康检查结果排查原因。

前提条件

您已完成使用 ARMS Prometheus 监控您的应用或组件的操作步骤,请参见使用教程概述

功能入口

  1. 登录 ARMS 控制台
  2. 在左侧导航栏单击 Prometheus 监控,并在 Prometheus 监控页面顶部选择地域,然后单击需要查看的 K8s 集群名称。
  3. 在左侧导航栏单击健康检查

查看健康检查结果

健康检测页面,您可以查看健康检查结果。健康检查结果主要是 ARMS Prometheus 监控各个阶段的运行数据,包括:

  1. Grafana 创建情况。
  2. API 请求情况。
    说明 自定义创建的 Grafana 大盘和除 K8s 集群外的自建集群通过 API URL 获取数据源。
  3. 容器服务 K8s 集群运行时状态采集情况。
  4. ARMS Prometheus Agent 采集条数及详情。
  5. 采集指标对应的采集任务(Job)详情。此项内容可以查看哪些采集任务(Job)是免费或者收费。
  6. 采集指标的数量统计情况。
  7. 获取 Promethues Metric 的种类数量,以及最近 1 分钟内的排序结果。

添加废弃指标

如果您想要解决单指标爆炸问题,或者不想监控某些指标,那么可以将其添加为废弃指标。

  1. 健康检测页面,单击右上角的编辑废弃指标
  2. 编辑废弃指标对话框,添加需要废弃的指标名称 metricName,多个 metricName 通过换行隔开。