查看监控信息

云数据库 SelectDB 版提供了丰富的性能监控数据,方便您查看和掌握集群的运行状态。监控指标通过Grafana仪表盘展示,并使用预设的PromQL查询语句。本文介绍如何在控制台查看集群监控信息。

前提条件

已开通应用实时监控服务ARMS(Application Real-Time Monitoring Service)服务。具体操作,请参见开通ARMS

操作步骤

  1. 登录云数据库 SelectDB 控制台

  2. 在页面左上角,选择实例所在地域。

  3. 实例列表页面,单击目标实例ID,进入到实例详情页面。

  4. 在左侧导航栏,单击监控告警

  5. 在监控告警页面,选择监控页签。

  6. 如果存在多个集群,您可以在监控页签内的左上角单击cluster选择不同集群,以查看不同集群的监控信息。

    说明
    • 监控指标通过Grafana仪表盘展示,并使用预设的PromQL查询语句。在编辑页面中,您可以修改PromQL以查看不同的监控指标,但是修改后的内容不支持保存。

    • 监控指标看板默认展示最近1小时内的集群监控信息,您可在页面右上角选择时间自行调整。

监控项

云数据库 SelectDB 版监控项分为节点基础指标和集群请求指标两个维度。

节点基础指标

集群内节点的基础指标,集群以32核为一个节点步长。例如您的集群配置为64核则会将其分为两个节点。

监控项

说明

单位

CPU使用率

所选中集群的所有节点CPU使用率。如果扩容集群或其他资源消耗性操作前,您可以从这个图表中找到集群使用率最低的时间。

%

内存使用率

所选中集群的所有节点内存利用率。

%

内存使用量

所选中集群的所有节点内存使用量。如果内存使用量持续较高,您可以考虑对目标集群进行扩容,具体操作请参见集群伸缩

MB

磁盘读写次数(IOPS)

所选中集群的所有节点硬盘 I/O 利用情况。每100 GB硬盘缓存可提供约5000 IOPS,如果您需要更的高硬盘读写能力,可以考虑拓展更多的硬盘缓存或者集群。

次/s

网络流入吞吐量

所选中集群的所有节点每秒通过网络写入的平均速度。

Byte/s

网络流出吞吐量

所选中集群的所有节点每秒通过网络读取的平均速度。如果网络读的查询速度较慢,您需要修改缓存设置,尽量的减少查询时的网络读取。

Byte/s

集群请求指标

云数据库 SelectDB 版集群的请求指标以及实例维度的指标。

监控项

说明

单位

每秒查询次数(QPS)

每秒连接到集群的查询请求总数。

查询成功率

所选中集群每分钟内查询成功的查询语句占全部查询的比例。当查询成功率发生异常下降时,考虑是否出现了集群、节点的故障。

%

查询平均耗时

所选中集群每分钟内所有查询的平均耗时。

ms

99th 查询耗时

所选中集群给定时间内升序排列排在第99%位置的请求的响应时间;用于反映集群慢查询的速度。

ms

导入数据速度

所选中集群每秒导入的数据记录条数。

Row/s

数据合并 Compaction Score

所选中集群数据文件的合并压力,Score越大,进行合并计算的压力越大。大于 2000 后会触发写入反压,数据合并压力大的表会出现数据写入失败。

失效节点数

当前集群失效节点的个数。

缓存命中率

缓存读写操作占所有读写操作的百分比。

%

缓存读写吞吐量

集群各节点硬盘每秒的读取/写入吞吐速率

Byte/s

远端存储读吞吐量

单位时间内读取远端存储的数据量。

Byte/s

连接数

当前实例的会话数。

对象存储容量

当前实例数据所占用的对象存储容量。

Byte