本文介绍YARN指标的详细信息。
YARN指标包含以下部分:
YARN-HOME
| 参数 | 指标 | 描述 |
|---|---|---|
| NumOpenConnections | yarn_resourcemanager_rpc_NumOpenConnections | 打开连接数。 |
| AppsSubmitted | yarn_cluster_appsSubmitted | 集群已经提交的任务数。 |
| AppsCompleted | yarn_cluster_appsCompleted | 集群已经完成的任务数。 |
| AppsPending | yarn_cluster_appsPending | 集群正在阻塞的任务数。 |
| AppsFailed | yarn_cluster_appsFailed | 集群失败的任务数。 |
| AppsKilled | yarn_cluster_appsKilled | 集群被终止掉的任务数。 |
| MemoryReservedMB | yarn_cluster_reservedMB | 集群被预留调度的内存大小。单位:MB。 |
| MemoryAvailableMB | yarn_cluster_availableMB | 集群可用内存大小。单位:MB。 |
| MemoryAllocatedMB | yarn_cluster_allocatedMB | 集群已分配的内存大小。单位:MB。 |
| MemoryTotalMB | yarn_cluster_totalMB | 集群总内存大小。单位:MB。 |
| ReserveVCore | yarn_cluster_reservedVirtualCores | 集群被预留调度的虚拟核数。 |
| AvailableVCore | yarn_cluster_availableVirtualCores | 集群可用虚拟核数。 |
| AllocatedVCore | yarn_cluster_allocatedVirtualCores | 集群已分配虚拟核数。 |
| TotalVCore | yarn_cluster_totalVirtualCores | 集群总虚拟核数。 |
| ContainerAllocated | yarn_cluster_containersAllocated | 集群已经分配的Container个数。 |
| ContainerReserved | yarn_cluster_containersReserved | 集群预留调度的Container个数。 |
| ContainerPending | yarn_cluster_containersPending | 集群阻塞调度的Container个数。 |
| TotalNode | yarn_cluster_totalNodes | 集群总节点数。 |
| ActiveNode | yarn_cluster_activeNodes | 集群存活的节点数。 |
| LostNode | yarn_cluster_lostNodes | 集群死掉的节点数。 |
| UnhealthyNode | yarn_cluster_unhealthyNodes | 集群不健康的节点数。 |
| DecommissioningNode | yarn_cluster_decommissioningNodes | 集群正在退役的节点数。 |
| DecommissionNode | yarn_cluster_decommissionedNodes | 集群已经退役的节点数。 |
| RebootedNodes | yarn_cluster_rebootedNodes | 集群重启的节点数。 |
| ShutdownNodes | yarn_cluster_shutdownNodes | 集群关闭的节点数。 |
YARN-Queues
| 参数 | 指标 | 描述 |
|---|---|---|
| AppsSubmitted | yarn_resourcemanager_queue_AppsSubmitted | ResourceManager调度器特定队列提交的任务数。 |
| AppsRunning | yarn_resourcemanager_queue_AppsRunning | ResourceManager调度器特定队列正在运行的任务数。 |
| AppsPending | yarn_resourcemanager_queue_AppsPending | ResourceManager调度器特定队列阻塞的任务数。 |
| AppsCompleted | yarn_resourcemanager_queue_AppsCompleted | ResourceManager调度器特定队列完成的任务数。 |
| AppsKilled | yarn_resourcemanager_queue_AppsKilled | ResourceManager调度器特定队列被杀死的任务数。 |
| AppsFailed | yarn_resourcemanager_queue_AppsFailed | ResourceManager调度器特定队列失败的任务数。 |
| AllocatedMB | yarn_resourcemanager_queue_AllocatedMB | ResourceManager调度器特定队列分配的内存大小。单位:MB。 |
| AllocatedVCores | yarn_resourcemanager_queue_AllocatedVCores | ResourceManager调度器特定队列分配的虚拟核数。 |
| AllocatedContainers | yarn_resourcemanager_queue_AllocatedContainers | ResourceManager调度器特定队列分配的container数。 |
| AggregateContainersAllocated | yarn_resourcemanager_queue_AggregateContainersAllocated | ResourceManager调度器特定队列累积的container分配数。 |
| AggregateContainersReleased | yarn_resourcemanager_queue_AggregateContainersReleased | ResourceManager调度器特定队列累积的container释放数。 |
| AvailableMB | yarn_resourcemanager_queue_AvailableMB | ResourceManager调度器特定队可用内存。单位:MB。 |
| AvailableVCores | yarn_resourcemanager_queue_AvailableVCores | ResourceManager调度器特定队列可用核数。 |
| PendingMB | yarn_resourcemanager_queue_PendingMB | ResourceManager调度器特定队列阻塞调度内存。单位:MB。 |
| PendingVCores | yarn_resourcemanager_queue_PendingVCores | ResourceManager调度器特定队列阻塞调度核数。 |
| PendingContainers | yarn_resourcemanager_queue_PendingContainers | ResourceManager调度器特定队列阻塞调度container个数。 |
| ReservedMB | yarn_resourcemanager_queue_ReservedMB | ResourceManager调度器特定队列预留内存。单位:MB。 |
| ReservedVCores | yarn_resourcemanager_queue_ReservedVCores | ResourceManager调度器特定队列预留核数。 |
| ReservedContainers | yarn_resourcemanager_queue_ReservedContainers | ResourceManager调度器特定队列预留container数。 |
| Capacity UsedCapacity | yarn_resourcemanager_queue_usedCapacity | ResourceManager Capacity调度器特定队列在父队列中使用的capacity。单位:%。 |
| Capacity AbsoluteUsedCapacity | yarn_resourcemanager_queue_absoluteUsedCapacity | ResourceManager Capacity调度器特定队列在总集群中使用的capacity。单位:%。 |
| Capacity NumApplications | yarn_resourcemanager_queue_numApplications | ResourceManager Capacity调度器特定队列在调度器中的application个数。 |
| Capacity NumActiveApplications | yarn_resourcemanager_queue_numActiveApplications | ResourceManager Capacity调度器特定队列运行的application个数。 |
| Capacity NumPendingApplications | yarn_resourcemanager_queue_numPendingApplications | ResourceManager Capacity调度器特定队列阻塞调度的application个数。 |
| Capacity NumContainers | yarn_resourcemanager_queue_numContainers | ResourceManager Capacity调度器特定队列container个数。 |
| Capacity VCoresUsed | yarn_resourcemanager_queue_vCoresUsed | ResourceManager Capacity调度器特定队列使用的虚拟核数。 |
| Capacity MemoryUsed | yarn_resourcemanager_queue_memoryUsed | ResourceManager Capacity调度器特定队列使用的内存。单位:MB。 |
| Capacity AMVCoresUsed | yarn_resourcemanager_queue_amResourceUsed_vCores | ResourceManager Capacity调度器特定队列application master使用的虚拟核数。 |
| Capacity AMMemoryUsed | yarn_resourcemanager_queue_amResourceUsed_memory | ResourceManager Capacity调度器特定队列application master使用的内存。单位:MB。 |
| Fair AMMemoryUsed | yarn_resourcemanager_queue_amUsedResources_memory | ResourceManager Fair调度器特定队列application master使用的内存大小,3.X版本依赖。单位:MB。 |
| Fair AMVCoresUsed | yarn_resourcemanager_queue_amUsedResources_vCores | ResourceManager Fair调度器特定队列applicatio master使用的虚拟核数,3.X版本依赖。 |
| Fair MemoryReserved | yarn_resourcemanager_queue_reservedResources_memory | ResourceManager Fair调度器特定队列预留的内存大小,3.X版本依赖。单位:MB。 |
| Fair VCoresReserved | yarn_resourcemanager_queue_reservedResources_vCores | ResourceManager Fair调度器特定队列预留的虚拟核数,3.X版本依赖。 |
| Fair MemoryUsed | yarn_resourcemanager_queue_usedResources_memory | ResourceManager Fair调度器特定队列使用的内存大小。单位:MB。 |
| Fair VCoresUsed | yarn_resourcemanager_queue_usedResources_vCores | ResourceManager Fair调度器特定队列使用的虚拟核数。 |
| Fair NumPendingApps | yarn_resourcemanager_queue_numPendingApps | ResourceManager Fair调度器特定队列阻塞调度的application个数。 |
| Fair NumActiveApps | yarn_resourcemanager_queue_numActiveApps | ResourceManager Fair调度器特定队列正在运行的application个数。 |
YARN-Resourcemanagers
| 参数 | 指标 | 描述 |
|---|---|---|
| Average Processing time | yarn_resourcemanager_rpc_RpcProcessingTimeAvgTime | ResouceManager Rpc队列平均处理时间。单位:ms。 |
| CallQueueLength | yarn_resourcemanager_rpc_CallQueueLength | ResouceManager Rpc队列积压长度。 |
| MemNonHeapUsedM | yarn_resourcemanager_jvm_MemNonHeapUsedM | ResouceManager JVM非堆内存使用。单位:MB。 |
| MemNonHeapCommittedM | yarn_resourcemanager_jvm_MemNonHeapCommittedM | ResouceManager JVM非堆commit的内存。单位:MB。 |
| MemNonHeapMaxM | yarn_resourcemanager_jvm_MemNonHeapMaxM | ResouceManager JVM非堆最大可用内存。单位:MB。 |
| MemHeapUsedM | yarn_resourcemanager_jvm_MemHeapUsedM | ResouceManager JVM堆内存使用。单位:MB。 |
| MemHeapCommittedM | yarn_resourcemanager_jvm_MemHeapCommittedM | ResouceManager JVM堆内存commit的内存。单位:MB。 |
| MemHeapMaxM | yarn_resourcemanager_jvm_MemHeapMaxM | ResouceManager JVM堆内存最大可用内存。单位:MB。 |
| MemMaxM | yarn_resourcemanager_jvm_MemMaxM | ResouceManager JVM最大内存。单位:MB。 |
| GcCount | yarn_resourcemanager_jvm_GcCount | ResouceManager JVM gc次数。 |
| Total GcTime | yarn_resourcemanager_jvm_GcTimeMillis | ResouceManager JVM gc时间。单位:ms。 |
YARN-NodeManagers
| 参数 | 参数 | 描述 |
|---|---|---|
| ContainersLaunched count | yarn_nodemanager_ContainersLaunched | NodeManager Container启动个数。 |
| ContainersCompleted count | yarn_nodemanager_ContainersCompleted | NodeManager Container完成个数。 |
| ContainersFailed | yarn_nodemanager_ContainersFailed | NodeManager Container失败个数。 |
| ContainersKilled | yarn_nodemanager_ContainersKilled | NodeManager Container被杀掉个数。 |
| ContainersIniting | yarn_nodemanager_ContainersIniting | NodeManager Container初始化中个数。 |
| ContainersRunning | yarn_nodemanager_ContainersRunning | NodeManager Container正在运行个数。 |
| BadLocalDirs | yarn_nodemanager_BadLocalDirs | NodeManager磁盘损坏个数。 |
| GoodLocalDirsDiskUtilizationPerc | yarn_nodemanager_GoodLocalDirsDiskUtilizationPerc | NodeManager磁盘利用率。单位:%。 |
| MemNonHeapUsedM | yarn_nodemanager_jvm_MemNonHeapUsedM | NodeManager JVM非堆内存使用。单位:MB。 |
| MemNonHeapCommittedM | yarn_nodemanager_jvm_MemNonHeapCommittedM | NodeManager JVM非堆commit的内存。单位:MB。 |
| MemNonHeapMaxM | yarn_nodemanager_jvm_MemNonHeapMaxM | NodeManager JVM非堆最大可用内存。单位:MB。 |
| MemHeapUsedM | yarn_nodemanager_jvm_MemHeapUsedM | NodeManager JVM堆内存使用。单位:MB。 |
| MemHeapCommittedM | yarn_nodemanager_jvm_MemHeapCommittedM | NodeManager JVM堆内存commit的内存。单位:MB。 |
| MemHeapMaxM | yarn_nodemanager_jvm_MemHeapMaxM | NodeManager JVM堆内存最大可用内存。单位:MB。 |
| MemMaxM | yarn_nodemanager_jvm_MemMaxM | NodeManager JVM最大内存。单位:MB。 |
| GcCount | yarn_nodemanager_jvm_GcCount | NodeManager JVM gc次数。 |
| Total GcTime | yarn_nodemanager_jvm_GcTimeMillis | NodeManager JVM gc时间。单位:ms。 |
| ShuffleOutputBytes | yarn_nodemanager_shuffle_ShuffleOutputBytes | NodeManager Shuffle输出的字节数。单位:Byte。 |
| ShuffleOutputsFailed | yarn_nodemanager_shuffle_ShuffleOutputsFailed | NodeManager Shuffle输出失败个数。 |
| ShuffleOutputsOK | yarn_nodemanager_shuffle_ShuffleOutputsOK | NodeManager Shuffle输出成功个数。 |
| ShuffleConnections | yarn_nodemanager_shuffle_ShuffleConnections | NodeManager Shuffle连接数。 |
| LastHealthUpdate | yarn_nodemanager_lastHealthUpdate | NodeManager最近一次健康状态时间。 |
| AllocatedContainers | yarn_nodemanager_AllocatedContainers | NodeManager运行的container个数。 |
| AllocatedGB | yarn_nodemanager_AllocatedGB | NodeManager使用的内存大小。单位:GB。 |
| AvailableGB | yarn_nodemanager_AvailableGB | NodeManager可用的内存大小。单位:GB。 |
| AllocatedVCores | yarn_nodemanager_AllocatedVCores | NodeManager使用的虚拟核数。 |
| AvailableVCores | yarn_nodemanager_AvailableVCores | NodeManager可用的虚拟核数。 |
YARN-JobHistory
| 参数 | 指标 | 描述 |
|---|---|---|
| MemNonHeapUsedM | yarn_jobhistory_jvm_MemNonHeapUsedM | Jobhistory JVM非堆内存使用。单位:MB。 |
| MemNonHeapCommittedM | yarn_jobhistory_jvm_MemNonHeapCommittedM | Jobhistory JVM非堆commit的内存。单位:MB。 |
| MemNonHeapMaxM | yarn_jobhistory_jvm_MemNonHeapMaxM | Jobhistory JVM非堆最大可用内存。单位:MB。 |
| MemHeapUsedM | yarn_jobhistory_jvm_MemHeapUsedM | Jobhistory JVM堆内存使用。单位:MB。 |
| MemHeapCommittedM | yarn_jobhistory_jvm_MemHeapCommittedM | Jobhistory JVM堆内存commit的内存。单位:MB。 |
| MemHeapMaxM | yarn_jobhistory_jvm_MemHeapMaxM | Jobhistory JVM堆内存最大可用内存。单位:MB。 |
| MemMaxM | yarn_jobhistory_jvm_MemMaxM | Jobhistory JVM最大内存。单位:MB。 |
| GcCount | yarn_jobhistory_jvm_GcCount | Jobhistory JVM gc次数。 |
| Total GcTime | yarn_jobhistory_jvm_GcTimeMillis | Jobhistory JVM gc时间。单位:ms。 |
YARN-TimelineServer
| 参数 | 指标 | 描述 |
|---|---|---|
| MemNonHeapUsedM | yarn_timelineserver_jvm_MemNonHeapUsedM | Timeline Server JVM非堆内存使用。单位:MB。 |
| MemNonHeapCommittedM | yarn_timelineserver_jvm_MemNonHeapCommittedM | Timeline Server JVM非堆commit的内存。单位:MB。 |
| MemNonHeapMaxM | yarn_timelineserver_jvm_MemNonHeapMaxM | Timeline Server JVM非堆最大可用内存。单位:MB。 |
| MemHeapUsedM | yarn_timelineserver_jvm_MemHeapUsedM | Timeline Server JVM堆内存使用。单位:MB。 |
| MemHeapCommittedM | yarn_timelineserver_jvm_MemHeapCommittedM | Timeline Server JVM堆内存commit的内存。单位:MB。 |
| MemHeapMaxM | yarn_timelineserver_jvm_MemHeapMaxM | Timeline Server JVM堆内存最大可用内存。单位:MB。 |
| MemMaxM | yarn_timelineserver_jvm_MemMaxM | Timeline Server JVM最大内存。单位:MB。 |
| GcCount | yarn_timelineserver_jvm_GcCount | Timeline Server JVM gc次数。 |
| Total GcTime | yarn_timelineserver_jvm_GcTimeMillis | Timeline Server JVM gc时间。单位:ms。 |
| GetEntitiesOps | yarn_timeline_GetEntitiesOps | Timeline Server获取批量entities操作数。 |
| GetEntitiesTimeAvgTime | yarn_timeline_GetEntitiesTimeAvgTime | Timeline Server获取批量entities平均时间。单位:ms。 |
| GetEntityOps | yarn_timeline_GetEntityOps | Timeline Server获取entity操作数。 |
| GetEntityTimeAvgTime | yarn_timeline_GetEntityTimeAvgTime | Timeline Server获取entity平均时间。单位:ms。 |
| GetEventsOps | yarn_timeline_GetEventsOps | Timeline Server获取批量events操作数。 |
| GetEventsTimeAvgTime | yarn_timeline_GetEventsTimeAvgTime | Timeline Server获取批量evnets平均时间。单位:ms。 |
| PostEntitiesOps | yarn_timeline_PostEntitiesOps | Timeline Server更新批量entities操作数。 |
| PostEntitiesTimeAvgTime | yarn_timeline_PostEntitiesTimeAvgTime | Timeline Server更新批量entities的平均时间。单位:ms。 |
| PutDomainOps | yarn_timeline_PutDomainOps | Timeline Server更新Domain操作数。 |
| PutDomainTimeAvgTime | yarn_timeline_PutDomainTimeAvgTime | Timeline Server更新Domain平均时间。单位:ms。 |
| GetDomainOps | yarn_timeline_GetDomainOps | Timeline Server获取Domain操作数。 |
| GetDomainTimeAvgTime | yarn_timeline_GetDomainTimeAvgTime | Timeline Server获取Domain平均时间。单位:ms。 |
| GetDomainsOps | yarn_timeline_GetDomainsOps | Timeline Server批量获取Domains操作数。 |
| GetDomainsTimeAvgTime | yarn_timeline_GetDomainsTimeAvgTime | Timeline Server批量获取Domains平均时间。单位:ms。 |