通过EMR Serverless StarRocks提供的监控报表功能,您可以实时获取并查看实例的运行状态及各项关键性能指标,从而实现快速问题定位。
使用限制
仅保存最近30天内的报表数据,超出此期限的数据将不再保留。
操作步骤
进入EMR Serverless StarRocks实例列表页面。
在左侧导航栏,选择
。在顶部菜单栏处,根据实际情况选择地域。
单击目标实例ID。
单击监控告警页签。
在监控报表页签,您可以根据资源组和时间条件进行筛选来查看当前的指标。
支持以下资源组:
default_wg:物化视图默认资源组。
default_mv_wg:查询任务默认资源组。
单击图表上方的图标,可以查看当前指标的含义。
监控指标说明
概况
指标名称 | 描述 |
FE可用性 | FE节点的可用性。 |
BE可用性 | BE节点的可用性。 |
FE可用节点 | FE可用节点的百分比。 |
BE可用节点 | BE可用节点的百分比。 |
FE节点数 | FE节点数量。 |
BE节点数 | BE节点数量。 |
资源组运行中查询任务数 | 当前资源组Running状态的查询任务数量。 |
DB数量 | 数据库数量。 |
Table数量 | 表数量。 |
Table数量分布 | 各数据库的表数量分布情况。 |
Tablet最大Compaction评分 | 每个BE节点上最高的Compaction评分。Compaction评分用于衡量一个表分区是否需要执行Compaction操作,通常在离线情况下,该值应低于100。然而,当出现大量导入任务时,该值可能会显著提高。如果该值大于800,需要进行手动干预来优化性能。 |
Disk使用量 | 磁盘使用量。 |
Disk容量 | 磁盘总容量。 |
Disk使用率 | 磁盘使用量百分比。 |
BE CPU空闲率 | BE节点的CPU空闲率。若该值低,则表明CPU正处于高负载状态。 |
BE Mem统计 | BE节点的内存使用情况。 |
BE IO使用率 | 每个BE节点的最大磁盘IO利用率。如果频繁观察到高利用率的情况,可根据实际需求对实例进行升配操作。 |
BE Disk使用率 | BE节点磁盘容量使用情况。 |
BE Disk使用量 | 包括以下指标参数:
|
BE Net发送/接收速率 | BE节点网络发送及接收的数据速率。 |
FE JVM堆统计 | 每个FE节点的JVM堆使用百分比。 |
FE RPS | 每个FE节点每秒的请求数,包括发送到FE的所有请求。 |
FE查询任务QPS | 所有FE节点处理的查询请求数量。 |
FE查询任务状态统计 | 查询任务状态统计涉及以下指标:
|
FE查询任务延迟百分位数 | 每个FE节点上查询延迟的百分位数。 |
FE连接数 | 每个FE节点的连接数。 |
BE查询扫描行数 | 执行查询过程中读取的数据行总数。 |
BE查询扫描数据量 | 执行查询过程中读取的字节数。 |
BE的Tablet数量 | 分布在各个BE节点上的Tablet总数。 |
导入任务数 | 显示已提交的加载作业和已完成的加载作业的计数器。如果加载提交是常规操作,则两条记录的任务数量变化趋势将表现为大致平行的线条走势。 |
表结构变更作业数 | 变更表结构作业数统计信息。 |
Rollup作业数 | Rollup作业数。 |
存算分离场景指标
该指标仅适用于存算分离版和数据湖分析版实例类型。
指标名称 | 描述 |
读延迟P95 | 读IO P95分位延迟。其中:
|
写延迟P95 | 写IO P95分位延迟。其中:
|
读吞吐量 | 读IO吞吐量。其中:
|
读IOPS | 读IOPS。其中:
|
写吞吐量 | 写IO吞吐量。其中:
|
写IOPS | 写IOPS。其中:
|
Data Cache命中率 | 本地存储缓存命中率,计算方式为缓存命中次数除总读取数据次数。 |
Data Cache驱逐次数 | 自上次启动以来缓存驱逐总次数。 |
Data Cache命中次数 | 本地存储缓存命中次数。 |
Data Cache未命中次数 | 本地缓存未命中次数。 |
资源组指标
指标名称 | 描述 |
资源组运行中查询任务数 | 当前资源组Running状态的查询任务数。 |
资源组使用CPU核数 | 当前资源组正在使用的CPU核数。该值为一个估计值,通常是在测量指标的两次时间点之间的平均使用量。 |
资源组CPU使用占比 | 当前资源组CPU使用时间占总CPU时间的百分比。 |
资源组Mem使用量 | 当前资源组使用的内存。 |
资源组触发大查询限制次数 | 当前资源组触发大查询限制次数。 |
- 本页导读 (1)