本文介绍FE与BE的相关监控项。
查看监控项
- FE:通过
http://fe_host:fe_http_port/metrics
方式访问;通过http://fe_host:fe_http_port/metrics?type=json
接口可以获取JSON格式的监控项。 - BE:通过
http://be_host:be_webserver_port/metrics
方式访问;通过http://be_host:be_webserver_port/metrics?type=json
接口可以获取JSON格式的监控项。
- 访问方式默认显示为Prometheus格式,更多内容,请参见Prometheus。
- Host为集群里,Master节点的IP地址。BE通常为内网IP;FE取决于您的网络环境,内网或者外网均可。
- http_port默认为:8031;webserver_port默认为:8041。可以通过show frontends命令获取。
FE监控项列表
doris_fe_snmp{name="tcp_in_errs"}
该监控项为/proc/net/snmp中的Tcp: InErrs字段值。表示当前接收到的错误的TCP包的数量,结合采样周期可以计算发生率。通常用于排查网络问题。
doris_fe_snmp{name="tcp_retrans_segs"}
该监控项为/proc/net/snmp中的Tcp: RetransSegs字段值。表示当前重传的TCP包的数量,结合采样周期可以计算发生率。通常用于排查网络问题。
doris_fe_snmp{name="tcp_in_segs"}
该监控项为/proc/net/snmp中的Tcp: InSegs字段值。表示当前接收到的所有TCP包的数量,通过(NEW_tcp_in_errs - OLD_tcp_in_errs) / (NEW_tcp_in_segs - OLD_tcp_in_segs)
可以计算接收到的TCP包错误率。通常用于排查网络问题。
doris_fe_snmp{name="tcp_out_segs"}
该监控项为/proc/net/snmp中的Tcp: OutSegs字段值。表示当前发送的所有带RST标记的TCP包的数量,通过(NEW_tcp_tcp_retrans_segs - OLD_tcp_retrans_segs) / (NEW_tcp_out_segs - OLD_tcp_out_segs)
可以计算TCP重传率。通常用于排查网络问题。
doris_fe_meminfo{name="memory_total"}
该监控项为/proc/meminfo中的MemTotal字段值。表示所有可用的内存大小,总的物理内存减去预留空间和内核大小。通常用于排查内存问题。
doris_fe_meminfo{name="memory_free"}
该监控项为/proc/meminfo中的MemFree字段值。表示系统尚未使用的内存,通常用于排查内存问题。
doris_fe_meminfo{name="memory_available"}
该监控项为/proc/meminfo中的MemAvailable字段值。真正的系统可用内存,系统中有些内存虽然已被使用但是可以回收的,所以这部分可回收的内存加上MemFree才是系统可用的内存。通常用于排查内存问题。
doris_fe_meminfo{name="buffers"}
该监控项为/proc/meminfo中的Buffers字段值。表示用来给块设备做缓存的内存(文件系统的Metadata、Pages),通常用于排查内存问题。
doris_fe_meminfo{name="cached"}
该监控项为/proc/meminfo中的Cached字段值。表示分配给文件缓冲区的内存,通常用于排查内存问题。
jvm_thread{type="count"}
该监控项表示FE节点当前JVM总的线程数量,包含Daemon线程和非Daemon线程,通常用于排查FE节点的JVM线程运行问题。
jvm_thread{type="peak_count"}
该监控项表示FE节点从JVM启动以来的最大峰值线程数量,通常用于排查FE节点的JVM线程运行问题。
jvm_thread{type="new_count"}
该监控项表示FE节点JVM中处于NEW状态的线程数量,通常用于排查FE节点的JVM线程运行问题。
jvm_thread{type="runnable_count"}
该监控项表示FE节点JVM中处于RUNNABLE状态的线程数量,通常用于排查FE节点的JVM线程运行问题。
jvm_thread{type="blocked_count"}
该监控项表示FE节点JVM中处于BLOCKED状态的线程数量,通常用于排查FE节点的JVM线程运行问题。
jvm_thread{type="waiting_count"}
该监控项表示FE节点JVM中处于WAITING状态的线程数量,通常用于排查FE节点的JVM线程运行问题。
jvm_thread{type="timed_waiting_count"}
该监控项表示FE节点JVM中处于TIMED_WAITING状态的线程数量,通常用于排查FE节点的JVM线程运行问题。
jvm_thread{type="terminated_count"}
该监控项表示FE节点JVM中处于TERMINATED状态的线程数量,通常用于排查FE节点的JVM线程运行问题。
BE监控项列表
doris_be_snmp{name="tcp_in_errs"}
该监控项为/proc/net/snmp中的Tcp: InErrs字段值。表示当前接收到的错误的TCP包的数量。结合采样周期可以计算发生率。通常用于排查网络问题。
doris_be_snmp{name="tcp_retrans_segs"}
该监控项为/proc/net/snmp中的Tcp: RetransSegs字段值。表示当前重传的TCP包的数量。结合采样周期可以计算发生率。通常用于排查网络问题。
doris_be_snmp{name="tcp_in_segs"}
该监控项为/proc/net/snmp中的Tcp: InSegs字段值。表示当前接收到的所有TCP包的数量。通过(NEW_tcp_in_errs - OLD_tcp_in_errs) / (NEW_tcp_in_segs - OLD_tcp_in_segs)
可以计算接收到的TCP包错误率。通常用于排查网络问题。
doris_be_snmp{name="tcp_out_segs"}
该监控项为/proc/net/snmp中的Tcp: OutSegs字段值。表示当前发送的所有带RST标记的TCP包的数量。通过(NEW_tcp_tcp_retrans_segs - OLD_tcp_retrans_segs) / (NEW_tcp_out_segs - OLD_tcp_out_segs)
可以计算TCP重传率。通常用于排查网络问题。
doris_be_compaction_mem_current_consumption
该监控项为Compaction使用的MemPool总和(所有Compaction线程)。通过该值,可以迅速判断Compaction是否占用过多内存,引起高内存占用甚至OOM等问题。通常用于排查内存使用问题。