性能监控

PolarDB控制台提供了丰富的性能监控项和秒级监控频率,方便您掌握集群的运行状态并通过细粒度的监控数据快速定位运维问题。

性能监控

  1. 登录PolarDB控制台

  2. 在左上角,选择集群所在地域。

  3. 找到目标集群,单击集群ID。

  4. 在左侧导航栏中,单击性能监控

  5. 您可以根据业务需求选择查看集群计算节点高级监控性能事件的监控信息。详细信息,请参见监控项说明

    • 集群性能监控:单击集群页签,在右侧设置时间段后单击确定

    • 计算节点性能监控:单击计算节点页签,在右侧选择节点并设置时间段后单击确定

    • 高级监控:单击高级监控页签,在下方选择节点并设置时间段后单击确定

    • 性能事件:单击性能事件页签,在下方选择节点并设置时间段后单击确定

监控项说明

类别

监控项

说明

集群

存储空间

展示数据空间、日志空间、临时空间和WAL日志空间的使用量。

CPU使用率

展示各节点的CPU使用率。

内存使用率

展示各节点的内存使用率。

计算节点

TPS

展示所选择节点的每秒事务数,包括每秒提交事务数、每秒死锁事务数、每秒回滚事务数等等。

CPU使用率

展示所选择节点的CPU使用率。

内存使用率

展示所选择节点的内存使用率。

连接

展示所选择节点的当前总连接数、活跃连接数和空闲连接数。

扫描行数

展示所选择节点每秒插入、读取、更新、删除、返回的行数。

数据库最大年龄

数据库最旧和最新的两个事务之间的事务ID差值。

I/O吞吐量

展示所选择节点的总I/O吞吐量、读I/O吞吐量、写I/O吞吐量。

IOPS

展示所选择节点的每秒读写次数,包括每秒读写总次数、每秒读次数、每秒写次数。

缓存

展示所选择节点每秒缓存读取次数和每秒磁盘读取次数。

缓存命中率

展示所选择节点的缓存命中率。

临时文件

展示所选择节点的临时文件数量和总大小。

高级监控

PolarDB CPU 利用率/内存利用率

展示所选择节点的CPU使用率/内存使用率。

TPS/QPS

展示所选择节点的每秒事务数/每秒请求数。

会话连接

展示所选择节点的当前总会话数和活跃会话数。

临时文件

展示所选节点的每秒临时文件生成数。

事务数量

展示所选节点的活跃事务数、空闲长事务数、空闲事务数、两阶段事务数、等待事务数和长事务数。

缓存

展示所选择节点每秒块命中率、块读取数和块命中数。

扫描行数

展示所选择节点每秒插入、读取、更新、删除的行数。

PolarDB 存储空间使用量

展示所选择节点的wal日志空间、用户数据、本地日志、实例空间、临时空间等占用的存储量。

PolarDB IOPS

展示所选择节点的每秒读写次数,包括每秒读写总次数、每秒读次数、每秒写次数、总I/O吞吐量、读I/O吞吐量、写I/O吞吐量。

性能事件

异常事件

展示所选节点的异常事件的统计信息。

优化事件

展示所选节点的优化事件的统计信息。

常见问题

  • Q:当集群无业务流量时,为何性能监控中的QPS还显示为大约10次/秒?

    A:因为系统后台存在监控、日志采集以及管控任务,大概每秒会产生10个左右的查询请求,对集群运行基本无影响。

  • Q:CPU使用率过高时,应该如何解决?

    A:建议您按如下步骤进行排查:

    • 确认是否有大量慢请求,建议优化慢SQL后再进行测试。

    • 确认CPU曲线是否与QPS或TPS曲线走向一致,若一致,说明该问题是事务高并发导致,可以考虑升级集群配置。

    • 若没有慢请求,CPU曲线与QPS或TPS曲线走向也不一致,请联系我们

  • Q:当前连接数远大于活跃连接数时,应该如何解决?

    A:您可以尝试将wait_timeoutinteractive_timeout参数值设置的小一些以加速空闲连接的释放。但建议最好在业务端使用完连接后及时关闭回收以减少空闲连接的存在。

相关API

API描述
DescribeDBClusterPerformance查询PolarDB集群的性能数据。
DescribeDBNodePerformance查询PolarDB集群节点的性能数据。
DescribeDBClusterMonitor查询PolarDB集群监控数据的采集频率。
ModifyDBClusterMonitor修改PolarDB集群监控数据的采集频率。