本文介绍FE与BE的相关监控项。

查看监控项

  • FE:通过http://fe_host:fe_http_port/metrics方式访问;通过http://fe_host:fe_http_port/metrics?type=json接口可以获取JSON格式的监控项。
  • BE:通过http://be_host:be_webserver_port/metrics方式访问;通过http://be_host:be_webserver_port/metrics?type=json接口可以获取JSON格式的监控项。
说明
  • 访问方式默认显示为Prometheus格式,更多内容,请参见Prometheus
  • Host为集群里,Master节点的IP地址。BE通常为内网IP;FE取决于您的网络环境,内网或者外网均可。
  • http_port默认为:8031;webserver_port默认为:8041。可以通过show frontends命令获取。

FE监控项列表

doris_fe_snmp{name="tcp_in_errs"}

该监控项为/proc/net/snmp中的Tcp: InErrs字段值。表示当前接收到的错误的TCP包的数量,结合采样周期可以计算发生率。通常用于排查网络问题。

doris_fe_snmp{name="tcp_retrans_segs"}

该监控项为/proc/net/snmp中的Tcp: RetransSegs字段值。表示当前重传的TCP包的数量,结合采样周期可以计算发生率。通常用于排查网络问题。

doris_fe_snmp{name="tcp_in_segs"}

该监控项为/proc/net/snmp中的Tcp: InSegs字段值。表示当前接收到的所有TCP包的数量,通过(NEW_tcp_in_errs - OLD_tcp_in_errs) / (NEW_tcp_in_segs - OLD_tcp_in_segs)可以计算接收到的TCP包错误率。通常用于排查网络问题。

doris_fe_snmp{name="tcp_out_segs"}

该监控项为/proc/net/snmp中的Tcp: OutSegs字段值。表示当前发送的所有带RST标记的TCP包的数量,通过(NEW_tcp_tcp_retrans_segs - OLD_tcp_retrans_segs) / (NEW_tcp_out_segs - OLD_tcp_out_segs)可以计算TCP重传率。通常用于排查网络问题。

doris_fe_meminfo{name="memory_total"}

该监控项为/proc/meminfo中的MemTotal字段值。表示所有可用的内存大小,总的物理内存减去预留空间和内核大小。通常用于排查内存问题。

doris_fe_meminfo{name="memory_free"}

该监控项为/proc/meminfo中的MemFree字段值。表示系统尚未使用的内存,通常用于排查内存问题。

doris_fe_meminfo{name="memory_available"}

该监控项为/proc/meminfo中的MemAvailable字段值。真正的系统可用内存,系统中有些内存虽然已被使用但是可以回收的,所以这部分可回收的内存加上MemFree才是系统可用的内存。通常用于排查内存问题。

doris_fe_meminfo{name="buffers"}

该监控项为/proc/meminfo中的Buffers字段值。表示用来给块设备做缓存的内存(文件系统的Metadata、Pages),通常用于排查内存问题。

doris_fe_meminfo{name="cached"}

该监控项为/proc/meminfo中的Cached字段值。表示分配给文件缓冲区的内存,通常用于排查内存问题。

jvm_thread{type="count"}

该监控项表示FE节点当前JVM总的线程数量,包含Daemon线程和非Daemon线程,通常用于排查FE节点的JVM线程运行问题。

jvm_thread{type="peak_count"}

该监控项表示FE节点从JVM启动以来的最大峰值线程数量,通常用于排查FE节点的JVM线程运行问题。

jvm_thread{type="new_count"}

该监控项表示FE节点JVM中处于NEW状态的线程数量,通常用于排查FE节点的JVM线程运行问题。

jvm_thread{type="runnable_count"}

该监控项表示FE节点JVM中处于RUNNABLE状态的线程数量,通常用于排查FE节点的JVM线程运行问题。

jvm_thread{type="blocked_count"}

该监控项表示FE节点JVM中处于BLOCKED状态的线程数量,通常用于排查FE节点的JVM线程运行问题。

jvm_thread{type="waiting_count"}

该监控项表示FE节点JVM中处于WAITING状态的线程数量,通常用于排查FE节点的JVM线程运行问题。

jvm_thread{type="timed_waiting_count"}

该监控项表示FE节点JVM中处于TIMED_WAITING状态的线程数量,通常用于排查FE节点的JVM线程运行问题。

jvm_thread{type="terminated_count"}

该监控项表示FE节点JVM中处于TERMINATED状态的线程数量,通常用于排查FE节点的JVM线程运行问题。

BE监控项列表

doris_be_snmp{name="tcp_in_errs"}

该监控项为/proc/net/snmp中的Tcp: InErrs字段值。表示当前接收到的错误的TCP包的数量。结合采样周期可以计算发生率。通常用于排查网络问题。

doris_be_snmp{name="tcp_retrans_segs"}

该监控项为/proc/net/snmp中的Tcp: RetransSegs字段值。表示当前重传的TCP包的数量。结合采样周期可以计算发生率。通常用于排查网络问题。

doris_be_snmp{name="tcp_in_segs"}

该监控项为/proc/net/snmp中的Tcp: InSegs字段值。表示当前接收到的所有TCP包的数量。通过(NEW_tcp_in_errs - OLD_tcp_in_errs) / (NEW_tcp_in_segs - OLD_tcp_in_segs) 可以计算接收到的TCP包错误率。通常用于排查网络问题。

doris_be_snmp{name="tcp_out_segs"}

该监控项为/proc/net/snmp中的Tcp: OutSegs字段值。表示当前发送的所有带RST标记的TCP包的数量。通过(NEW_tcp_tcp_retrans_segs - OLD_tcp_retrans_segs) / (NEW_tcp_out_segs - OLD_tcp_out_segs)可以计算TCP重传率。通常用于排查网络问题。

doris_be_compaction_mem_current_consumption

该监控项为Compaction使用的MemPool总和(所有Compaction线程)。通过该值,可以迅速判断Compaction是否占用过多内存,引起高内存占用甚至OOM等问题。通常用于排查内存使用问题。