为了让您可以实时掌握云数据库ClickHouse集群的状态,帮助您早期问题发现,快速定位故障,性能优化决策,云数据库ClickHouse提供了丰富的监控项。本文介绍云数据库ClickHouse集群的监控项以及其具体含义。
ClickHouse集群监控项说明
-
以下监控项是2021年12月01日之后购买的集群监控项详情。
-
2021年12月01日之前购买的集群,监控项详情,请参见旧版集群监控项说明。
社区版
|
监控项 |
单位 |
说明 |
|
磁盘吞吐 |
字节(Byte) |
磁盘读写的吞吐量(带宽)。 |
|
磁盘 IOPS |
次/秒 |
磁盘每秒进行读写操作的次数。 |
|
磁盘使用量 |
字节(Byte) |
磁盘空间的使用量。 |
|
磁盘使用量-单节点统计 |
字节(Byte) |
磁盘使用量(单节点上所有磁盘使用量总和)。 |
|
磁盘使用率 |
百分比(%) |
磁盘空间的使用量与最多可使用的磁盘空间容量的比值。 |
|
磁盘使用率-单节点统计 |
百分比(%) |
磁盘使用率(以节点为单位统计磁盘使用率)。 |
|
CPU 使用率 |
百分比(%) |
集群各节点的平均CPU使用率。 |
|
inode使用率 |
百分比(%) |
inode的使用个数占最多可使用的总个数的比值。 说明
inode是Linux系统中用来标识文件或目录的。 |
|
内存使用量 |
字节(Byte) |
集群各节点的内存使用量。 |
|
内存使用率 |
百分比(%) |
集群各节点的平均内存使用率。 |
|
Data Part个数 |
个 |
数据分片的总数。 |
|
Inactive Data Part个数 |
个 |
不活跃的数据分片个数。 |
|
ZooKeeper CPU使用率 |
百分比(%) |
集群ZooKeeper节点的平均CPU使用率。 |
|
ZooKeeper 内存使用率 |
百分比(%) |
集群ZooKeeper节点的平均内存使用率。 |
|
每秒写入大小 |
字节(Byte) |
集群各节点每秒写入的数据量。 |
|
每秒写入行数 |
行/秒 |
集群各节点每秒写入的行数。 |
|
QPS |
个 |
每秒处理的查询数目。 |
|
TPS |
个 |
每秒处理的事务数目。 |
|
网络吞吐 |
字节(Byte) |
网络带宽。 |
|
TCP连接数 |
个 |
集群的TCP连接个数。 |
|
HTTP连接数 |
个 |
集群的HTTP连接个数。 |
|
运行Init Query个数 |
个 |
正在运行的非转发查询语句个数。 |
|
运行Query个数 |
个 |
正在运行的查询语句个数。 |
|
失败Query个数 |
个 |
查询失败的语句个数。 |
|
失败Insert Query个数 |
个 |
插入失败的语句个数。 |
|
延迟Insert个数 |
个 |
延迟的插入语句个数。 |
|
失败Select Query个数 |
个 |
查询失败的语句个数。 |
|
运行Merge个数 |
个 |
正在运行的合并任务个数。 |
|
运行Mutation个数 |
个 |
正在运行的数据订正任务个数。 |
|
分布式表临时文件个数 |
个 |
分布式表临时文件的个数。 |
|
MaterializeMySQL个数 |
个 |
使用MaterializeMySQL引擎创建的同步数据库个数。 |
|
冷存使用量 |
字节(Byte) |
冷数据的存储量。 |
|
MaterializeMySQL同步失败个数 |
个 |
使用MaterializeMySQL引擎创建的同步数据库同步失败个数。 |
|
Kafka外表消费发生错误个数 |
个 |
同步失败的Kafka外表消费个数。 |
|
Zookeeper Leader |
- |
Zookeeper集群的Leader(取值为1的为leader节点)。 |
|
Kafka外表个数 |
个 |
已创建的Kafka外表个数。 |
|
节点队列堆积量 |
个 |
云数据库ClickHouse节点在Zookeeper上发送队列的数据包数量。 |
|
Zookeeper平均时延 |
毫秒 |
Zookeeper节点的平均时延。 |
|
Zookeeper Node数 |
个 |
Zookeeper的ZNode数量。 |
|
Zookeeper TPS |
次/秒 |
Zookeeper的TPS。 |
|
Zxid使用率 |
百分比(%) |
Zookeeper的Zxid使用率(Zxid使用率达到100%时会发生重新选主)。 |
企业版
|
监控项 |
单位 |
监控说明 |
|
CPU 使用率 |
百分比(%) |
集群各节点的平均CPU使用率。 |
|
CCU |
个 |
集群计算资源的使用量。 |
|
内存使用量 |
字节(Byte) |
集群各节点的内存使用量。 |
|
内存使用率 |
百分比(%) |
集群各节点的平均内存使用率。 |
|
OSS使用量 |
字节(Byte) |
集群存储资源的使用量。 |
|
Data Part个数 |
个 |
数据分片的总数。 |
|
Inactive Data Part个数 |
个 |
不活跃的数据分片个数。 |
|
Keeper CPU使用率 |
百分比(%) |
ClickHouse-Keeper的CPU使用率。 |
|
Keeper内存使用量 |
字节(Byte) |
ClickHouse-Keeper的内存使用量。 |
|
Keeper内存使用率 |
百分比(%) |
ClickHouse-Keeper的内存使用率。 |
|
每秒写入大小 |
字节(Byte) |
集群各节点每秒写入的数据量。 |
|
每秒写入行数 |
行/秒 |
集群各节点每秒写入的行数。 |
|
网络吞吐 |
字节(Byte) |
磁盘读写的吞吐量(带宽)。 |
|
OSS网络吞吐 |
字节(Byte) |
OSS读写的吞吐量(带宽)。 |
|
OSS IOPS |
次/秒 |
OSS每秒进行读写操作的次数。 |
|
TPS |
次/秒 |
每秒处理的事务数目。 |
|
QPS |
次/秒 |
每秒处理的查询数目。 |
|
运行Init Query个数 |
个 |
正在运行的非转发查询语句个数。 |
|
运行Query个数 |
个 |
正在运行的查询语句个数。 |
|
失败Query个数 |
个 |
节点中失败的Query数量。 |
|
失败Insert Query个数 |
个 |
插入失败的语句个数。 |
|
延迟Insert个数 |
个 |
延迟的插入语句个数。 |
|
失败Select Query个数 |
个 |
节点中失败的Select Query数量。 |
|
运行Mutation个数 |
个 |
正在运行的数据订正任务的数。 |
|
运行Merge个数 |
个 |
正在运行的合并任务个数。 |
|
TCP连接数 |
个 |
集群的TCP连接个数。 |
|
HTTP连接数 |
个 |
集群的HTTP连接个数。 |
|
MV Refresh失败数 |
个 |
集群中Refreshable Materialized View刷新失败个数。 |
|
MV Refresh平均耗时 |
时间(秒/分钟) |
集群中Refreshable Materialized View刷新平均耗时。 |
|
MV Refresh最大耗时 |
时间(秒/分钟) |
集群中Refreshable Materialized View刷新最大耗时。 |
旧版集群监控项说明
旧版集群指的是2021年12月01日之前购买的社区版集群。
|
监控项 |
单位 |
说明 |
|
CPU 使用率 |
百分比(%) |
集群各节点的CPU使用率。 |
|
内存使用率 |
百分比(%) |
集群各节点的内存使用率。 |
|
内存使用量 |
字节(Byte) |
集群各节点的内存使用量。 |
|
磁盘使用比率 |
百分比(%) |
磁盘空间的使用量与最多可使用的磁盘空间容量的比值。 |
|
磁盘使用量 |
字节(Byte) |
使用中的磁盘空间大小。 |
|
磁盘 IOPS |
次/秒 |
磁盘每秒进行读写操作的次数。 |
|
磁盘 IOPS 大小 |
字节(Byte) |
磁盘每秒读写数据的大小。 |
|
数据库连接使用比率 |
百分比(%) |
数据库使用连接数与规格最大可使用连接数的比值。 |
|
数据库使用连接数 |
个 |
数据库使用中的连接数。 |
|
TPS |
次/秒 |
每秒处理的事务数目。 |
|
每秒写入行数 |
行/秒 |
各节点每秒写入的行数。 |
|
每秒写入大小 |
字节(Byte) |
各节点每秒写入的大小。 |
|
QPS |
次/秒 |
每秒处理的查询数目。 |
|
ZK 的平均等待时长 |
毫秒 |
反映当前ZooKeeper的响应性能。 |
|
平均IO等待时长 |
毫秒 |
反映当前IO的响应性能。 |
|
平均CPU等待时长 |
毫秒 |
反映当前CPU的响应性能。 |