监控项说明

为了让您可以实时掌握云数据库ClickHouse集群的状态,帮助您早期问题发现,快速定位故障,性能优化决策,云数据库ClickHouse提供了丰富的监控项。本文介绍云数据库ClickHouse集群的监控项以及其具体含义。

ClickHouse集群监控项说明

说明
  • 以下监控项是2021年12月01日之后购买的集群监控项详情。

  • 2021年12月01日之前购买的集群,监控项详情,请参见旧版集群监控项说明

社区版

监控项

单位

说明

磁盘吞吐

字节(Byte)

磁盘读写的吞吐量(带宽)。

磁盘IOPS

次/秒

磁盘每秒进行读写操作的次数。

磁盘使用量

字节(Byte)

磁盘空间的使用量。

磁盘使用量-单节点统计

字节(Byte)

磁盘使用量(单节点上所有磁盘使用量总和)。

磁盘使用率

百分比(%)

磁盘空间的使用量与最多可使用的磁盘空间容量的比值。

磁盘使用率-单节点统计

百分比(%)

磁盘使用率(以节点为单位统计磁盘使用率)。

CPU使用率

百分比(%)

集群各节点的平均CPU使用率。

inode使用率

百分比(%)

inode的使用个数占最多可使用的总个数的比值。

说明

inode是Linux系统中用来标识文件或目录的。

内存使用量

字节(Byte)

集群各节点的内存使用量。

内存使用率

百分比(%)

集群各节点的平均内存使用率。

Data Part个数

数据分片的总数。

Inactive Data Part个数

不活跃的数据分片个数。

ZooKeeper CPU使用率

百分比(%)

集群ZooKeeper节点的平均CPU使用率。

ZooKeeper 内存使用率

百分比(%)

集群ZooKeeper节点的平均内存使用率。

每秒写入大小

字节(Byte)

集群各节点每秒写入的数据量。

每秒写入行数

行/秒

集群各节点每秒写入的行数。

QPS

每秒处理的查询数目。

TPS

每秒处理的事务数目。

网络吞吐

字节(Byte)

网络带宽。

TCP连接数

集群的TCP连接个数。

HTTP连接数

集群的HTTP连接个数。

运行Init Query个数

正在运行的非转发查询语句个数。

运行Query个数

正在运行的查询语句个数。

失败Query个数

查询失败的语句个数。

失败Insert Query个数

插入失败的语句个数。

延迟Insert个数

延迟的插入语句个数。

失败Select Query个数

查询失败的语句个数。

运行Merge个数

正在运行的合并任务个数。

运行Mutation个数

正在运行的数据订正任务个数。

分布式表临时文件个数

分布式表临时文件的个数。

MaterializeMySQL个数

使用MaterializeMySQL引擎创建的同步数据库个数。

冷存使用量

字节(Byte)

冷数据的存储量。

MaterializeMySQL同步失败个数

使用MaterializeMySQL引擎创建的同步数据库同步失败个数。

Kafka外表消费发生错误个数

同步失败的Kafka外表消费个数。

Zookeeper Leader

-

Zookeeper集群的Leader(取值为1的为leader节点)。

Kafka外表个数

已创建的Kafka外表个数。

节点队列堆积量

云数据库ClickHouse节点在Zookeeper上发送队列的数据包数量。

Zookeeper平均时延

毫秒

Zookeeper节点的平均时延。

Zookeeper Node数

Zookeeper的ZNode数量。

Zookeeper TPS

次/秒

Zookeeper的TPS。

Zxid使用率

百分比(%)

Zookeeper的Zxid使用率(Zxid使用率达到100%时会发生重新选主)。

企业版

监控项

单位

监控说明

CPU使用率

百分比(%)

集群各节点的平均CPU使用率。

CCU

集群计算资源的使用量。

内存使用量

字节(Byte)

集群各节点的内存使用量。

内存使用率

百分比(%)

集群各节点的平均内存使用率。

OSS使用量

字节(Byte)

集群存储资源的使用量。

Data Part个数

数据分片的总数。

Inactive Data Part个数

不活跃的数据分片个数。

Keeper CPU使用率

百分比(%)

ClickHouse-Keeper的CPU使用率。

Keeper内存使用量

字节(Byte)

ClickHouse-Keeper的内存使用量。

Keeper内存使用率

百分比(%)

ClickHouse-Keeper的内存使用率。

每秒写入大小

字节(Byte)

集群各节点每秒写入的数据量。

每秒写入行数

行/秒

集群各节点每秒写入的行数。

网络吞吐

字节(Byte)

磁盘读写的吞吐量(带宽)。

OSS网络吞吐

字节(Byte)

OSS读写的吞吐量(带宽)。

OSS IOPS

次/秒

OSS每秒进行读写操作的次数。

TPS

次/秒

每秒处理的事务数目。

QPS

次/秒

每秒处理的查询数目。

运行Init Query个数

正在运行的非转发查询语句个数。

运行Query个数

正在运行的查询语句个数。

失败Query个数

节点中失败的Query数量。

失败Insert Query个数

插入失败的语句个数。

延迟Insert个数

延迟的插入语句个数。

失败Select Query个数

节点中失败的Select Query数量。

运行Mutation个数

正在运行的数据订正任务的数。

运行Merge个数

正在运行的合并任务个数。

TCP连接数

集群的TCP连接个数。

HTTP连接数

集群的HTTP连接个数。

旧版集群监控项说明

说明

旧版集群指的是2021年12月01日之前购买的社区版集群。

监控项

单位

说明

CPU使用率

百分比(%)

集群各节点的CPU使用率。

内存使用率

百分比(%)

集群各节点的内存使用率。

内存使用量

字节(Byte)

集群各节点的内存使用量。

磁盘使用比率

百分比(%)

磁盘空间的使用量与最多可使用的磁盘空间容量的比值。

磁盘使用量

字节(Byte)

使用中的磁盘空间大小。

磁盘IOPS

次/秒

磁盘每秒进行读写操作的次数。

磁盘IOPS大小

字节(Byte)

磁盘每秒读写数据的大小。

数据库连接使用比率

百分比(%)

数据库使用连接数与规格最大可使用连接数的比值。

数据库使用连接数

数据库使用中的连接数。

TPS

次/秒

每秒处理的事务数目。

每秒写入行数

行/秒

各节点每秒写入的行数。

每秒写入大小

字节(Byte)

各节点每秒写入的大小。

QPS

次/秒

每秒处理的查询数目。

ZK的平均等待时长

毫秒

反映当前ZooKeeper的响应性能。

平均IO等待时长

毫秒

反映当前IO的响应性能。

平均CPU等待时长

毫秒

反映当前CPU的响应性能。