本文介绍Zookeeper监控的概览和详细信息。

前提条件

已创建Kafka、Zookeeper、Flink或Druid类型的集群。

监控入口

  1. 登录阿里云 E-MapReduce 控制台
  2. 单击上方的监控大盘
  3. 在左侧导航栏中,单击集群监控
  4. 集群状态列表页面,单击待查看集群所在行的监控详情
  5. 在左侧导航栏中,单击服务监控 > Zookeeper,进入Zookeeper服务监控概览页面。

Zookeeper监控概览页面

Zookeeper服务监控概览页面,展示了该集群Zookeeper服务相关的最近的告警和异常信息,以及Zookeeper各个节点状态的列表。

Overview_page

Zookeeper各个节点状态列表如下。

参数 说明
主机名称 Zookeeper节点的主机名,单击主机名可查看该节点的监控详情信息。
主从状态 Zookeeper当前的角色:
  • Follower
  • Leader
端口状态 Zookeeper节点上端口的状态,绿色表示可用,红色表示不可用。
CPU Zookeeper节点上CPU使用情况。
Memory Zookeeper节点上内存使用情况。
说明 Zookeeper节点状态列表支持回放功能。

Zookeeper节点监控详情页面

在Zookeeper服务监控概览页面,单击Zookeeper节点状态列表中的主机名可以进入Zookeeper节点监控的详情页面。Zookeeper
  • Zookeeper核心指标。
    • Latency:包括最大延时、最小延时和平均延时。
    • Packets:包括收到的数据包数目和发送的数据包数目。
    • Alive Connections:活跃的连接数目。
    • Outstanding Requests:堆积的连接数。
    • File Descriptors
      • Max file descriptor:Zookeeper进程最大能使用的文件描述符数目。
      • Open file descriptor:Zookeeper进程已经使用的文件描述符数目。
  • Zookeeper进程启停历史。
    参数 说明
    时间 操作发生的时间点。
    启动/重启/停止 说明本次对组件操作的类型,包括启动、停止和重启。
    是否自动拉起 说明本次操作是否由E-MapReduce的保活机制自动拉起,对于异常退出的组件,EMR Agent自动拉起保证服务的可用性。
    启动用户 本次操作的Linux用户,对于停止状态的进程无该信息。
    PID 本次操作产生的进程ID,对于停止状态的进程无该信息。
    PPID 本次操作产生的父进程ID,对于停止状态的进程无该信息。
    启动参数 本次操作产生的进程的详细启动参数,对于停止状态的进程无该信息。