借助于阿里云ARMS Prometheus监控服务和Grafana的指标存储和展示能力,云消息队列 Kafka 版提供仪表盘功能。该功能可帮助您一站式、全方位、多维度地统计和观测指标,进而快速了解业务的运行状态。
前提条件
创建服务关联角色
角色名称:AliyunServiceRoleForAlikafka
角色策略名称:AliyunServiceRolePolicyForAlikafka
权限说明:允许云消息队列 Kafka 版使用该角色访问您的服务(云监控和ARMS服务)以完成云监控和仪表盘相关功能。
具体文档说明:服务关联角色。
计费说明
云消息队列 Kafka 版指标在阿里云ARMS Prometheus监控服务中属于基础指标,基础指标免费使用,因此使用Prometheus大盘功能不收取费用。
Metrics指标详情
Metrics指标中字段说明如下:
字段 | 取值 |
Metrics类型 |
|
Label |
|
实例Metrics指标
Metrics类型 | Metrics名称 | 描述 | Labels |
Gauge | kafka_disk_log_size | 实例存储大小。单位:Byte。 |
|
Gauge | kafka_server_cloudenhancedreplicamanager_allreplicascount | 所有副本的总分区数。 |
|
Gauge | kafka_server_socket_server_metrics_connection_count | 连接数。 |
|
Gauge | kafka_instance_io_spec_write | 实例发送预留规格。 |
|
Gauge | kafka_instance_io_spec_read | 实例消费预留规格。 |
|
Counter | kafka_server_brokertopicmetrics_bytesin_total | 生产流量(jmx-exporter指标)。 |
|
Counter | kafka_server_brokertopicmetrics_bytesout_total | 消费流量(jmx-exporter指标)。 |
|
Counter | kafka_server_brokertopicmetrics_failedproducerequests_total | 生产者失败请求量。 |
|
Counter | kafka_server_brokertopicmetrics_totalproducerequests_total | 生产者总请求量。 |
|
Counter | kafka_server_brokertopicmetrics_failedfetchrequests_total | 消费者失败请求量。 |
|
Counter | kafka_server_brokertopicmetrics_totalfetchrequests_total | 消费者总请求量。 |
|
Gauge | kafka_network_socketserver_expiredconnectionskilledcount | 过期连接数。 |
|
Summary | kafka_network_requestmetrics_requestbytes | 请求体的大小。 |
|
Counter | kafka_server_brokertopicmetrics_bytesrejected_total | 当记录批处理大小大于max.message.bytes配置时,每个Topic被拒绝的流量,单位:Byte。 |
|
Counter | kafka_server_brokertopicmetrics_nokeycompactedtopicrecords_total | Compact Topic没有设置key的记录数。 |
|
Counter | kafka_server_brokertopicmetrics_invalidmessagecrcrecords_total | CRC校验失败次数。 |
|
Counter | kafka_server_brokertopicmetrics_invalidmagicnumberrecords_total | 消息版本校验失败次数。 |
|
Counter | kafka_server_brokertopicmetrics_invalidoffsetorsequencerecords_total | 不连续Offset或Sequence Number导致的消息验证失败次数。 |
|
Topic Metrics指标
Metrics类型 | Metrics名称 | 描述 | Labels |
Gauge | kafka_log_log_size | Topic分区存储大小。 |
|
Gauge | kafka_topic_partition_current_offset | 分区最大Offset。 |
|
Gauge | kafka_topic_partition_oldest_offset | 分区最小Offset。 |
|
Gauge | kafka_consumergroup_lag | 消息堆积量。 |
|
Counter | kafka_server_brokertopicmetrics_totalfetchrequests_total | 请求次数。 |
|
Counter | kafka_server_brokertopicmetrics_bytesin_total | 生产流量(jmx-exporter指标)。 |
|
Counter | kafka_server_brokertopicmetrics_bytesout_total | 流出流量,单位:Byte。 |
|
Counter | kafka_server_brokertopicmetrics_messagesin_total | 消息流入量,单位:message。 |
|
Group Metrics指标
Metrics类型 | Metrics名称 | 描述 | Labels |
Gauge | kafka_consumergroup_lag | 消息堆积总量。 |
|
Counter | kafka_consumergroup_current_offset | Group消费位点。 |
|
在Kafka控制台查看仪表盘
登录云消息队列 Kafka 版控制台,在概览页面的资源分布区域,选择地域。
在实例列表页面,单击目标实例名称。
在左侧导航栏,单击
。在仪表盘页面右上角设置时间范围,查看实例的存储大小、分区数、连接数、流量流入流出等相关指标。
如需查看Topic和Group的仪表盘监控数据,请在Topic和Group的详情页面的仪表盘页签查看。
Topic详情页面:可查看指定Topic的生产相关指标以及生产者客户端相关指标。
Group 详情页面:可查看指定Group的消费堆积相关指标以及消费者客户端相关指标。
在Grafana控制台查看仪表盘
登录可观测可视化 Grafana 版控制台,在左侧导航栏单击工作区管理。
在工作区管理页面,单击目标工作区右侧的访问地址URL链接进入Grafana。
根据不同版本的Grafana查看仪表盘。
Grafana 9.x版本
在Grafana左侧导航栏,单击
图标,然后单击Browse。
在Browse页签,单击目标目录下的监控大盘,即可查看目标大盘上的所有监控图表。
例如,需要查看华东1(杭州)地域下某个实例的大盘数据,在
cloud-product-prometheus_cn-hangzhou
为前缀的目录下单击kafka-dashboard-v3,然后在大盘页面输入该实例ID,即可查看该实例的监控数据。
Grafana 10.x版本
在Grafana首页,单击页面左上角的
图标。
在Grafana左侧导航栏,选择仪表板,单击目标目录下的监控大盘,即可查看目标大盘上的所有监控图表。
例如,需要查看华东1(杭州)地域下某个实例的大盘数据,在
cloud-product-prometheus_cn-hangzhou
为前缀的目录下单击kafka-dashboard-v3,然后在大盘页面输入该实例ID,即可查看该实例的监控数据。
常见问题
如何获取仪表盘指标数据?
使用主账号登录ARMS控制台。
在左侧导航栏单击接入中心。
在接入中心页面的搜索文本框输入
Kafka
,并单击搜索图标。在搜索的结果中,选择需要接入的云服务(如阿里云 Kafka 消息队列服务)。接入的具体操作,请参见步骤一:接入云服务监控数据。
说明若需获取云消息队列 Kafka 版Serverless 实例的指标数据,则必须在接入时,在配置信息中打开高级监控指标开关。否则,仅能获取非 Serverless 实例的指标数据。
接入成功后,在左侧导航栏单击接入管理。
在接入管理页面,单击云服务区域环境页签。
在云服务区域环境列表中,单击目标环境名称进入云服务环境详情页面。
在组件管理页签的基本信息区域,单击Prometheus 实例后的云服务地域。
在设置页签上,可以获取不同的数据访问方式。
如何将仪表盘的指标数据接入自建Grafana?
云消息队列 Kafka 版的所有指标数据已保存到您的阿里云可观测监控 Prometheus 版中,您可以通过可观测监控 Prometheus 版提供的API将云消息队列 Kafka 版的仪表盘的指标数据接入到本地自建Grafana中。
具体操作,请参见使用HTTP API地址对接Grafana或自建应用中接入Prometheus数据。
在接入前,请确保可观测监控 Prometheus 版在当前云消息队列 Kafka 版实例所在地域已成功接入阿里云 Kafka 消息队列服务。