本文介绍Druid监控的概览和详细信息。

前提条件

已创建Druid类型的集群。

监控入口

  1. 登录阿里云 E-MapReduce 控制台
  2. 单击上方的监控大盘
  3. 在左侧导航栏中,单击集群监控
  4. 集群状态列表页面,单击Hadoop类型集群所在行的监控详情
  5. 在左侧导航栏中,单击服务监控 > Druid,进入Druid服务监控概览页面。

DRUID 服务监控概览页面

DRUID 服务监控概览页面,展示了 DRUID 服务基础指标图表、近期告警与异常、核心组件状态列表(包括Broker、Coordinator、Historical、Overlord、Middle Manager)、DRUID Query核心性能指标和Druid Ingestion性能指标。

服务监控概览
  • DRUID 服务基础指标图表:显示当天的告警数据、Task数量、Segment数量和Historical 缓存用量。
  • DRUID 服务最近异常和告警:默认展示该集群最近一天 DRUID 服务相关的异常和告警。
  • DRUID 服务Broker节点状态列表。Broker
    参数 说明
    主机名称 当前Broker的主机名称。单击主机名称可查看该节点的监控详情信息。
    端口状态 显示当前Broker进程的端口是否正常,绿色表示正常、红色表示异常。
    进程CPU使用率 当前Broker进程的CPU使用率。
    堆内存 当前Broker进程的内存使用情况统计,包括Heap Init、Heap Committed、Heap Used、Heap Max。
    非堆内存 当前Broker进程的非堆内存使用情况统计,包括NonHeap Committed、NonHeap Used、NonHeap Init。
    JVM GC统计信息 使用jstat -gcutil的格式展示了当前Broker进程的GC统计数据:
    • S0:幸存1区当前使用比例。
    • S1:幸存2区当前使用比例。
    • O:老年代使用百分比。
    • E:Eden区容量使用比例。
    • M:元数据区使用比例。
    • CCS:压缩使用比例。
    • YGCT:年轻代垃圾回收消耗时间。
    • FGCT:老年代垃圾回收消耗时间。
    • GCT:垃圾回收消耗总时间。
    • YGC:年轻代垃圾回收次数。
    • FGC:老年代垃圾回收次数。
  • DRUID服务Coordinator节点状态列表。Coordinator具体表格内容说明,参见 DRUID服务Broker节点状态列表章节。
  • DRUID服务Historical节点状态列表。Historical具体表格内容说明,参见 DRUID服务Broker节点状态列表章节。
  • DRUID服务Overlord节点状态列表。Overlord具体表格内容说明,参见 DRUID服务Broker节点状态列表章节。
  • DRUID服务Middle Manager节点状态列表。Middle Manager具体表格内容说明,参见 DRUID服务Broker节点状态列表章节。
  • Druid Queries核心性能指标。Druid Queries展示 Druid 查询的性能指标,Average Queries 是指一分钟的平均 query 次数,Average Qeury Time 表示平均每次 query 的耗时,可以选择不同的 datasource 和 query 类型,默认是所有 datasource 和所有 query 类型。Druid Queries核心性能指标曲线图可以自定义选择时间区间范围和时间聚合粒度。
  • Druid Ingestion核心性能指标。Ingestion

    Druid Ingestion 性能指标,展示了 Druid 集群在数据摄取方面的性能,Events Processed 和 Rows Output 都是展示一分钟内的次数,可以根据不同的 datasource 进行过滤。Druid Ingestion 核心性能指标曲线图可以自定义选择时间区间范围和时间聚合粒度。

Druid 各组件监控详情页面

在 DRUID 服务监控概览页面,单击各组件状态列表中的主机名,可以进入各组件(包括 Broker、Coordinator、Historical、Overlord、Middle Manager)监控详情页面。

详情页面包括组件进程 JVM 指标监控、组件进程文件描述符监控和组件进程的启停历史等。监控详情页面内容说明与其它服务组件监控详情页面类似。