Prometheus监控

阿里云Prometheus监控提供统一采集、存储和显示阿里云云服务的监控数据,并提供对应的Grafana监控大盘和告警。本文介绍阿里云Prometheus监控的指标详情和使用方法。

指标详情

Prometheus监控指标详情如下表所示。

指标类型

指标名称

描述

单位

实例

instance_message_input

实例消息生产流量

bytes/s

instance_message_output

实例消息消费流量

bytes/s

instance_reqs_input

实例消息生产发送次数

次/秒

instance_message_num_input

实例消息生产条数

个/秒

instance_reqs_output

实例消息消费次数

次/秒

instance_disk_capacity

实例磁盘使用率

%

instance_tcp_num

实例单节点TCP连接数量

instance_tcp_num_sum

实例TCP总连接数量

instance_public_tcp_num

实例单节点公网TCP连接数量

instance_public_tcp_num_sum

实例公网TCP总连接数量

Topic

topic_message_input

Topic消息生产流量

bytes/s

topic_message_output

Topic消息消费流量

bytes/s

topic_reqs_input

Topic消息生产发送次数

次/秒

topic_reqs_output

Topic消息消费次数

次/秒

topic_message_num_input

Topic消息生产条数

个/秒

Group

message_accumulation

消息堆积总量

message_accumulation_onetopic

消息堆积量(Topic级别)

rebalance_generation

GroupRebalance次数

group_message_num_output

消费总速率

个/秒

group_message_num_output_onetopic

消费速率(Topic级别)

个/秒

group_message_num_output_onetopic_onepartition

消费速率(Partition级别)

个/秒

Kafka控制台查看监控数据

  1. 登录云消息队列 Kafka 版控制台,在概览页面的资源分布区域,选择地域。

  2. 实例列表页面,单击目标实例名称。

  3. 在左侧导航栏,单击可观测 > Prometheus监控

  4. Prometheus监控页面,在右上角设置时间范围,查看监控数据。

    如需查看TopicGroupPrometheus监控数据,请在TopicGroup的详情页面的Prometheus监控页签查看。

Grafana控制台查看监控数据

  1. 登录可观测可视化 Grafana 版控制台,在左侧导航栏单击工作区管理

  2. 工作区管理页面,单击目标工作区右侧的访问地址URL链接进入Grafana。

  3. 根据不同版本的Grafana查看监控数据。

    Grafana 9.x版本

    1. Grafana左侧导航栏,单击image图标,然后单击Browse

    2. Browse页签,单击目标目录下的监控大盘,即可查看目标大盘上的所有监控图表。

      例如,需要查看华东1(杭州)地域下某个实例的大盘数据,在cloud-product-prometheus_cn-hangzhou为前缀的目录下单击kafka-instance,即可查看对应的监控数据。

    Grafana 10.x版本

    1. Grafana首页,单击页面左上角的image图标。

    2. Grafana左侧导航栏,选择仪表板,单击目标目录下的监控大盘,即可查看目标大盘上的所有监控图表。

      例如,需要查看华东1(杭州)地域下某个实例的大盘数据,在cloud-product-prometheus_cn-hangzhou为前缀的目录下单击kafka-instance,即可查看对应的监控数据。

常见问题

如何获取仪表盘指标数据?

  1. 使用主账号登录ARMS控制台

  2. 在左侧导航栏单击接入中心

  3. 接入中心页面的搜索文本框输入Kafka,并单击搜索图标。

  4. 在搜索的结果中,选择需要接入的云服务(如阿里云 Kafka 消息队列服务)。接入的具体操作,请参见步骤一:接入云服务监控数据

  5. 接入成功后,在左侧导航栏单击接入管理

  6. 接入管理页面,单击云服务区域环境页签。

  7. 云服务区域环境列表中,单击目标环境名称进入云服务环境详情页面。

  8. 组件管理页签的基本信息区域,单击Prometheus 实例后的云服务地域。

  9. 设置页签上,可以获取不同的数据访问方式。

如何将仪表盘的指标数据接入自建Grafana?

云消息队列 Kafka 版的所有指标数据已保存到您的阿里云可观测监控 Prometheus 版中,您可以通过可观测监控 Prometheus 版提供的API云消息队列 Kafka 版的仪表盘的指标数据接入到本地自建Grafana中。

具体操作,请参见使用HTTP API地址对接Grafana或自建应用中接入Prometheus数据

说明

在接入前,请确保可观测监控 Prometheus 版在当前云消息队列 Kafka 版实例所在地域已成功接入阿里云 Kafka 消息队列服务。