云数据库ClickHouse提供了丰富的性能监控数据,方便您查看和掌握集群的运行状态。本文介绍如何在控制台查看集群监控信息。

前提条件

  • 已开通阿里云Prometheus服务。
  • 已升级云数据库ClickHouse
说明 首次使用集群监控时,会在监控告警页面看到需要开通阿里云Prometheus和需要升级云数据库ClickHouse的提醒。如果在监控告警页面显示了监控信息,说明已经开通了阿里云Prometheus服务并且云数据库ClickHouse集群符合查看监控信息的要求。

操作步骤

  1. 登录云数据库ClickHouse控制台
  2. 在页面左上角,选择目标集群所在的地域。
  3. 集群列表页面,选择默认实例列表云原生版本实例列表,单击目标集群ID。
  4. 单击左侧导航栏中的监控告警
  5. 监控告警页面,选择集群监控,默认展示最新1小时的集群监控信息。
    为提升用户体验,云数据库ClickHouse对控制台进行了优化,2021年12月01日之后购买的集群提供了更加全面的性能监控数据。
    说明 为方便理解,本文将优化之前的控制台称为旧控制台,优化之后的控制台称为新控制台,此分类仅适用于本功能。

    2021年12月01日之后购买的集群,监控信息具体请参见新控制台监控项。2021年12月01日之前购买的集群,监控信息具体请参见旧控制台监控项

新控制台监控项

社区兼容版

监控项 说明
磁盘吞吐 磁盘读写的吞吐量(带宽)。
磁盘IOPS 磁盘每秒进行读写操作的次数。
磁盘使用量 磁盘空间的使用量。单位:MByte。
磁盘使用率 磁盘空间的使用量与最多可使用的磁盘空间容量的比值。
inode使用率 inode的使用个数占最多可使用的总个数的比值。
Data Part个数 数据分片的总数。
内存使用量 集群各节点的内存使用量。单位:MByte。
Inactive Data Part个数 不活跃的数据分片个数。
CPU使用率 集群各节点的平均CPU使用率。
内存使用率 集群各节点的平均内存使用率。
每秒写入大小 集群各节点每秒写入的数据量。单位:MByte。
网络吞吐 网络带宽。
QPS 每秒处理的查询数目。
每秒写入行数 集群各节点每秒写入的行数。
TCP连接数 集群的TCP连接个数。
TPS 每秒处理的事务数目。
运行Query个数 正在运行的查询语句个数。
运行Init Query个数 正在运行的非转发查询语句个数。
运行Mutation个数 正在运行的数据订正任务个数。
HTTP连接数 集群的HTTP连接个数。
分布式DDL个数 分布式DDL语句的个数。
失败Query个数 查询失败的语句个数。
MaterializeMySQL个数 使用MaterializeMySQL引擎创建的同步数据库个数。
失败Insert Query个数 插入失败的语句个数。
Kafka外表个数 已创建的Kafka外表个数。
失败Select Query个数 查询失败的语句个数。
冷存使用量 冷数据的存储量。
运行Merge个数 正在运行的合并任务个数。
MaterializeMySQL同步失败个数 使用MaterializeMySQL引擎创建的同步数据库同步失败个数。
延迟Insert个数 延迟的插入语句个数。
Kafka外表消费发生错误个数 同步失败的Kafka消费表个数。
分布式表临时文件个数 分布式表临时文件的个数。

云原生版

监控项 说明
磁盘吞吐 磁盘读写的吞吐量(带宽)。
磁盘IOPS 磁盘每秒进行读写操作的次数。
磁盘使用量 磁盘空间的使用量。单位:MByte。
磁盘使用率 磁盘空间的使用量与最多可使用的磁盘空间容量的比值。
inode使用率 inode的使用个数占最多可使用的总个数的比值。
Data Part个数 数据分片的总数。
内存使用量 计算组的内存使用量。单位:MByte。
内存使用率 计算组的平均内存使用率。
CPU使用率 计算组的平均CPU使用率。
网络吞吐 网络带宽。
每秒写入大小 计算组每秒写入的数据量。单位:MByte。
每秒写入行数 计算组每秒写入的行数。
QPS 每秒处理的查询数目。
TPS 每秒处理的事务数目。
连接数 连接集群的客户端个数。
失败Query个数 查询失败的语句个数。
运行Query个数 正在运行的查询语句个数。
运行Merge个数 正在运行的合并任务个数。
运行Mutation个数 正在运行的数据订正任务个数。
延迟Insert个数 延迟的插入语句个数。
分布式DDL个数 分布式DDL语句的个数。
分布式表临时文件个数 分布式表临时文件的个数。
冷存使用量 冷数据的存储量。

旧控制台监控项

监控项 说明
CPU使用率 集群各节点的CPU使用率。
内存使用率 集群各节点的内存使用率。
内存使用量 集群各节点的内存使用量。单位:MByte。
磁盘使用比率 使用中的磁盘空间与规格最大可使用磁盘空间的比值。
磁盘使用量 使用中的磁盘空间大小。单位:MByte。
磁盘IOPS 磁盘每秒进行读写操作的次数。
磁盘IOPS大小 磁盘每秒读写数据的大小。
数据库连接使用比率 数据库使用连接数与规格最大可使用连接数的比值。
数据库使用连接数 数据库使用中的连接数目。
TPS 每秒处理的事务数目。
每秒写入行数 各节点每秒写入的行数。
每秒写入大小 各节点每秒写入的大小。单位:MByte。
QPS 每秒处理的查询数目。
ZK的平均等待时长 反应当前ZooKeeper的响应性能。单位:毫秒。
平均IO等待时长 反应当前IO的响应性能。单位:毫秒。
平均CPU等待时长 反应当前CPU的响应性能。单位:毫秒。