本文介绍Hive监控的概览和详细信息。

前提条件

已创建Hadoop类型的集群。

监控入口

  1. 登录阿里云E-MapReduce控制台
  2. 单击上方的监控大盘
  3. 在左侧导航栏中,单击集群监控
  4. 集群状态列表页面,单击待查看集群所在行的监控详情
  5. 在左侧导航栏中,单击服务监控 > Hive,进入Hive服务监控概览页面。

HIVE监控概览页

Hive监控概览页面,展示了该集群Hive服务的基础指标图表、最近的告警和异常信息、MetaStore状态列表、HiveServer2状态列表。状态列表均支持回放功能。

Hive_overview
  • Hive基础指标数据图表:默认显示当天的告警数据、MetaStore、HiveServer2和文件描述信息。
  • Hive相关告警:告警与详情展示该集群当天与Hive服务相关的严重异常事件。
  • MetaStore状态列表:展示该集群各个MetaStore最新的状态数据。
    参数 说明
    主机名称 当前MetaStore进程所在主机的主机名称。单击主机名可查看该节点的监控详情信息。
    端口状态 显示当前MetaStore进程的端口是否正常,绿色表示正常、红色表示异常。
    进程CPU使用率 当前MetaStore进程的CPU使用率。
    堆内存 当前MetaStore进程的内存使用情况统计,包括Heap Used、Heap Committed、Heap Max、Heap Init。
    非堆内容 当前MetaStore进程的非堆内存使用情况统计,包括NonHeap Used、NonHeap Committed、NonHeap Init。
    JVM GC统计信息
    • S0:幸存1区当前使用比例。
    • S1:幸存2区当前使用比例。
    • O:老年代使用比例。
    • E:Eden区容量使用比例。
    • M:元数据区使用比例。
    • CCS:压缩使用比例。
    • YGCT:年轻代垃圾回收消耗时间。
    • FGCT:老年代垃圾回收消耗时间。
    • GCT:垃圾回收消耗总时间。
    • YGC:年轻代垃圾回收次数。
    • FGC:老年代垃圾回收次数。
  • HiveServer2状态列表:展示该集群各个HiveServer2最新的状态数据。

    各参数详细信息请参见MetaStore状态列表参数信息

MetaStore监控详情页面

在Hive监控概览页面,单击MetaStore状态列表的主机名称,可以进入对应MetaStore监控详情页。

  • MetaStore进程JVM指标,包括MetaStore进程内存使用情况、MetaStore进程GC时间、MetaStore进程GC次数、堆内存、非堆内存。
  • MetaStore进程文件描述符信息,展示了MetaStore进程可以使用的最大文件描述符数目和当前已经使用的文件描述符数目。
  • MetaStore Threads指标,展示MetaStore进程的线程数目统计。
  • MetaStore进程启停历史。
    参数 说明
    时间 操作发生的时间点。
    启动/重启/停止 说明本次对组件操作的类型,包括启动、停止和重启。
    是否自动拉起 说明本次操作是否由E-MapReduce的保活机制自动拉起,对于异常退出的组件,EMR Agent自动拉起保证服务的可用性。
    启动用户 本次操作的Linux用户,对于停止状态的进程无该信息。
    PID 本次操作产生的进程ID,对于停止状态的进程无该信息。
    PPID 本次操作产生的父进程ID,对于停止状态的进程无该信息。
    启动参数 本次操作产生的进程的详细启动参数,对于停止状态的进程无该信息。

HiveServer2监控详情页面

在Hive监控概览页面,单击HiveServer2状态列表的主机名称,可以进入对应HiveServer2监控详情页。

  • HiveServer2进程JVM指标,包括HiveServer2进程内存使用情况、HiveServer2进程GC时间、HiveServer2进程GC次数、堆内存、非堆内存。
  • HiveServer2进程文件描述符信息,展示了HiveServer2进程可以使用的最大文件描述符数目和当前已经使用的文件描述符数目。
  • HiveServer2 Threads指标,展示HiveServer2进程的线程数目统计。
  • HiveServer2进程启停历史。
    参数 说明
    时间 操作发生的时间点。
    启动/重启/停止 说明本次对组件操作的类型,包括启动、停止和重启。
    是否自动拉起 说明本次操作是否由E-MapReduce的保活机制自动拉起,对于异常退出的组件,EMR Agent自动拉起保证服务的可用性。
    启动用户 本次操作的Linux用户,对于停止状态的进程无该信息。
    PID 本次操作产生的进程ID,对于停止状态的进程无该信息。
    PPID 本次操作产生的父进程ID,对于停止状态的进程无该信息。
    启动参数 本次操作产生的进程的详细启动参数,对于停止状态的进程无该信息。