本文介绍YARN指标的详细信息。
YARN指标包含以下部分:
YARN-HOME
参数 | 指标 | 描述 |
---|---|---|
NumOpenConnections | yarn_resourcemanager_rpc_NumOpenConnections | 打开连接数。 |
AppsSubmitted | yarn_cluster_appsSubmitted | 集群已经提交的任务数。 |
AppsCompleted | yarn_cluster_appsCompleted | 集群已经完成的任务数。 |
AppsPending | yarn_cluster_appsPending | 集群正在阻塞的任务数。 |
AppsFailed | yarn_cluster_appsFailed | 集群失败的任务数。 |
AppsKilled | yarn_cluster_appsKilled | 集群被终止掉的任务数。 |
MemoryReservedMB | yarn_cluster_reservedMB | 集群被预留调度的内存大小。单位:MB。 |
MemoryAvailableMB | yarn_cluster_availableMB | 集群可用内存大小。单位:MB。 |
MemoryAllocatedMB | yarn_cluster_allocatedMB | 集群已分配的内存大小。单位:MB。 |
MemoryTotalMB | yarn_cluster_totalMB | 集群总内存大小。单位:MB。 |
ReserveVCore | yarn_cluster_reservedVirtualCores | 集群被预留调度的虚拟核数。 |
AvailableVCore | yarn_cluster_availableVirtualCores | 集群可用虚拟核数。 |
AllocatedVCore | yarn_cluster_allocatedVirtualCores | 集群已分配虚拟核数。 |
TotalVCore | yarn_cluster_totalVirtualCores | 集群总虚拟核数。 |
ContainerAllocated | yarn_cluster_containersAllocated | 集群已经分配的Container个数。 |
ContainerReserved | yarn_cluster_containersReserved | 集群预留调度的Container个数。 |
ContainerPending | yarn_cluster_containersPending | 集群阻塞调度的Container个数。 |
TotalNode | yarn_cluster_totalNodes | 集群总节点数。 |
ActiveNode | yarn_cluster_activeNodes | 集群存活的节点数。 |
LostNode | yarn_cluster_lostNodes | 集群死掉的节点数。 |
UnhealthyNode | yarn_cluster_unhealthyNodes | 集群不健康的节点数。 |
DecommissioningNode | yarn_cluster_decommissioningNodes | 集群正在退役的节点数。 |
DecommissionNode | yarn_cluster_decommissionedNodes | 集群已经退役的节点数。 |
RebootedNodes | yarn_cluster_rebootedNodes | 集群重启的节点数。 |
ShutdownNodes | yarn_cluster_shutdownNodes | 集群关闭的节点数。 |
YARN-Queues
参数 | 指标 | 描述 |
---|---|---|
AppsSubmitted | yarn_resourcemanager_queue_AppsSubmitted | ResourceManager调度器特定队列提交的任务数。 |
AppsRunning | yarn_resourcemanager_queue_AppsRunning | ResourceManager调度器特定队列正在运行的任务数。 |
AppsPending | yarn_resourcemanager_queue_AppsPending | ResourceManager调度器特定队列阻塞的任务数。 |
AppsCompleted | yarn_resourcemanager_queue_AppsCompleted | ResourceManager调度器特定队列完成的任务数。 |
AppsKilled | yarn_resourcemanager_queue_AppsKilled | ResourceManager调度器特定队列被杀死的任务数。 |
AppsFailed | yarn_resourcemanager_queue_AppsFailed | ResourceManager调度器特定队列失败的任务数。 |
AllocatedMB | yarn_resourcemanager_queue_AllocatedMB | ResourceManager调度器特定队列分配的内存大小。单位:MB。 |
AllocatedVCores | yarn_resourcemanager_queue_AllocatedVCores | ResourceManager调度器特定队列分配的虚拟核数。 |
AllocatedContainers | yarn_resourcemanager_queue_AllocatedContainers | ResourceManager调度器特定队列分配的container数。 |
AggregateContainersAllocated | yarn_resourcemanager_queue_AggregateContainersAllocated | ResourceManager调度器特定队列累积的container分配数。 |
AggregateContainersReleased | yarn_resourcemanager_queue_AggregateContainersReleased | ResourceManager调度器特定队列累积的container释放数。 |
AvailableMB | yarn_resourcemanager_queue_AvailableMB | ResourceManager调度器特定队可用内存。单位:MB。 |
AvailableVCores | yarn_resourcemanager_queue_AvailableVCores | ResourceManager调度器特定队列可用核数。 |
PendingMB | yarn_resourcemanager_queue_PendingMB | ResourceManager调度器特定队列阻塞调度内存。单位:MB。 |
PendingVCores | yarn_resourcemanager_queue_PendingVCores | ResourceManager调度器特定队列阻塞调度核数。 |
PendingContainers | yarn_resourcemanager_queue_PendingContainers | ResourceManager调度器特定队列阻塞调度container个数。 |
ReservedMB | yarn_resourcemanager_queue_ReservedMB | ResourceManager调度器特定队列预留内存。单位:MB。 |
ReservedVCores | yarn_resourcemanager_queue_ReservedVCores | ResourceManager调度器特定队列预留核数。 |
ReservedContainers | yarn_resourcemanager_queue_ReservedContainers | ResourceManager调度器特定队列预留container数。 |
Capacity UsedCapacity | yarn_resourcemanager_queue_usedCapacity | ResourceManager Capacity调度器特定队列在父队列中使用的capacity。单位:%。 |
Capacity AbsoluteUsedCapacity | yarn_resourcemanager_queue_absoluteUsedCapacity | ResourceManager Capacity调度器特定队列在总集群中使用的capacity。单位:%。 |
Capacity NumApplications | yarn_resourcemanager_queue_numApplications | ResourceManager Capacity调度器特定队列在调度器中的application个数。 |
Capacity NumActiveApplications | yarn_resourcemanager_queue_numActiveApplications | ResourceManager Capacity调度器特定队列运行的application个数。 |
Capacity NumPendingApplications | yarn_resourcemanager_queue_numPendingApplications | ResourceManager Capacity调度器特定队列阻塞调度的application个数。 |
Capacity NumContainers | yarn_resourcemanager_queue_numContainers | ResourceManager Capacity调度器特定队列container个数。 |
Capacity VCoresUsed | yarn_resourcemanager_queue_vCoresUsed | ResourceManager Capacity调度器特定队列使用的虚拟核数。 |
Capacity MemoryUsed | yarn_resourcemanager_queue_memoryUsed | ResourceManager Capacity调度器特定队列使用的内存。单位:MB。 |
Capacity AMVCoresUsed | yarn_resourcemanager_queue_amResourceUsed_vCores | ResourceManager Capacity调度器特定队列application master使用的虚拟核数。 |
Capacity AMMemoryUsed | yarn_resourcemanager_queue_amResourceUsed_memory | ResourceManager Capacity调度器特定队列application master使用的内存。单位:MB。 |
Fair AMMemoryUsed | yarn_resourcemanager_queue_amUsedResources_memory | ResourceManager Fair调度器特定队列application master使用的内存大小,3.X版本依赖。单位:MB。 |
Fair AMVCoresUsed | yarn_resourcemanager_queue_amUsedResources_vCores | ResourceManager Fair调度器特定队列applicatio master使用的虚拟核数,3.X版本依赖。 |
Fair MemoryReserved | yarn_resourcemanager_queue_reservedResources_memory | ResourceManager Fair调度器特定队列预留的内存大小,3.X版本依赖。单位:MB。 |
Fair VCoresReserved | yarn_resourcemanager_queue_reservedResources_vCores | ResourceManager Fair调度器特定队列预留的虚拟核数,3.X版本依赖。 |
Fair MemoryUsed | yarn_resourcemanager_queue_usedResources_memory | ResourceManager Fair调度器特定队列使用的内存大小。单位:MB。 |
Fair VCoresUsed | yarn_resourcemanager_queue_usedResources_vCores | ResourceManager Fair调度器特定队列使用的虚拟核数。 |
Fair NumPendingApps | yarn_resourcemanager_queue_numPendingApps | ResourceManager Fair调度器特定队列阻塞调度的application个数。 |
Fair NumActiveApps | yarn_resourcemanager_queue_numActiveApps | ResourceManager Fair调度器特定队列正在运行的application个数。 |
YARN-Resourcemanagers
参数 | 指标 | 描述 |
---|---|---|
Average Processing time | yarn_resourcemanager_rpc_RpcProcessingTimeAvgTime | ResouceManager Rpc队列平均处理时间。单位:ms。 |
CallQueueLength | yarn_resourcemanager_rpc_CallQueueLength | ResouceManager Rpc队列积压长度。 |
MemNonHeapUsedM | yarn_resourcemanager_jvm_MemNonHeapUsedM | ResouceManager JVM非堆内存使用。单位:MB。 |
MemNonHeapCommittedM | yarn_resourcemanager_jvm_MemNonHeapCommittedM | ResouceManager JVM非堆commit的内存。单位:MB。 |
MemNonHeapMaxM | yarn_resourcemanager_jvm_MemNonHeapMaxM | ResouceManager JVM非堆最大可用内存。单位:MB。 |
MemHeapUsedM | yarn_resourcemanager_jvm_MemHeapUsedM | ResouceManager JVM堆内存使用。单位:MB。 |
MemHeapCommittedM | yarn_resourcemanager_jvm_MemHeapCommittedM | ResouceManager JVM堆内存commit的内存。单位:MB。 |
MemHeapMaxM | yarn_resourcemanager_jvm_MemHeapMaxM | ResouceManager JVM堆内存最大可用内存。单位:MB。 |
MemMaxM | yarn_resourcemanager_jvm_MemMaxM | ResouceManager JVM最大内存。单位:MB。 |
GcCount | yarn_resourcemanager_jvm_GcCount | ResouceManager JVM gc次数。 |
Total GcTime | yarn_resourcemanager_jvm_GcTimeMillis | ResouceManager JVM gc时间。单位:ms。 |
YARN-NodeManagers
参数 | 参数 | 描述 |
---|---|---|
ContainersLaunched count | yarn_nodemanager_ContainersLaunched | NodeManager Container启动个数。 |
ContainersCompleted count | yarn_nodemanager_ContainersCompleted | NodeManager Container完成个数。 |
ContainersFailed | yarn_nodemanager_ContainersFailed | NodeManager Container失败个数。 |
ContainersKilled | yarn_nodemanager_ContainersKilled | NodeManager Container被杀掉个数。 |
ContainersIniting | yarn_nodemanager_ContainersIniting | NodeManager Container初始化中个数。 |
ContainersRunning | yarn_nodemanager_ContainersRunning | NodeManager Container正在运行个数。 |
BadLocalDirs | yarn_nodemanager_BadLocalDirs | NodeManager磁盘损坏个数。 |
GoodLocalDirsDiskUtilizationPerc | yarn_nodemanager_GoodLocalDirsDiskUtilizationPerc | NodeManager磁盘利用率。单位:%。 |
MemNonHeapUsedM | yarn_nodemanager_jvm_MemNonHeapUsedM | NodeManager JVM非堆内存使用。单位:MB。 |
MemNonHeapCommittedM | yarn_nodemanager_jvm_MemNonHeapCommittedM | NodeManager JVM非堆commit的内存。单位:MB。 |
MemNonHeapMaxM | yarn_nodemanager_jvm_MemNonHeapMaxM | NodeManager JVM非堆最大可用内存。单位:MB。 |
MemHeapUsedM | yarn_nodemanager_jvm_MemHeapUsedM | NodeManager JVM堆内存使用。单位:MB。 |
MemHeapCommittedM | yarn_nodemanager_jvm_MemHeapCommittedM | NodeManager JVM堆内存commit的内存。单位:MB。 |
MemHeapMaxM | yarn_nodemanager_jvm_MemHeapMaxM | NodeManager JVM堆内存最大可用内存。单位:MB。 |
MemMaxM | yarn_nodemanager_jvm_MemMaxM | NodeManager JVM最大内存。单位:MB。 |
GcCount | yarn_nodemanager_jvm_GcCount | NodeManager JVM gc次数。 |
Total GcTime | yarn_nodemanager_jvm_GcTimeMillis | NodeManager JVM gc时间。单位:ms。 |
ShuffleOutputBytes | yarn_nodemanager_shuffle_ShuffleOutputBytes | NodeManager Shuffle输出的字节数。单位:Byte。 |
ShuffleOutputsFailed | yarn_nodemanager_shuffle_ShuffleOutputsFailed | NodeManager Shuffle输出失败个数。 |
ShuffleOutputsOK | yarn_nodemanager_shuffle_ShuffleOutputsOK | NodeManager Shuffle输出成功个数。 |
ShuffleConnections | yarn_nodemanager_shuffle_ShuffleConnections | NodeManager Shuffle连接数。 |
LastHealthUpdate | yarn_nodemanager_lastHealthUpdate | NodeManager最近一次健康状态时间。 |
AllocatedContainers | yarn_nodemanager_AllocatedContainers | NodeManager运行的container个数。 |
AllocatedGB | yarn_nodemanager_AllocatedGB | NodeManager使用的内存大小。单位:GB。 |
AvailableGB | yarn_nodemanager_AvailableGB | NodeManager可用的内存大小。单位:GB。 |
AllocatedVCores | yarn_nodemanager_AllocatedVCores | NodeManager使用的虚拟核数。 |
AvailableVCores | yarn_nodemanager_AvailableVCores | NodeManager可用的虚拟核数。 |
YARN-JobHistory
参数 | 指标 | 描述 |
---|---|---|
MemNonHeapUsedM | yarn_jobhistory_jvm_MemNonHeapUsedM | Jobhistory JVM非堆内存使用。单位:MB。 |
MemNonHeapCommittedM | yarn_jobhistory_jvm_MemNonHeapCommittedM | Jobhistory JVM非堆commit的内存。单位:MB。 |
MemNonHeapMaxM | yarn_jobhistory_jvm_MemNonHeapMaxM | Jobhistory JVM非堆最大可用内存。单位:MB。 |
MemHeapUsedM | yarn_jobhistory_jvm_MemHeapUsedM | Jobhistory JVM堆内存使用。单位:MB。 |
MemHeapCommittedM | yarn_jobhistory_jvm_MemHeapCommittedM | Jobhistory JVM堆内存commit的内存。单位:MB。 |
MemHeapMaxM | yarn_jobhistory_jvm_MemHeapMaxM | Jobhistory JVM堆内存最大可用内存。单位:MB。 |
MemMaxM | yarn_jobhistory_jvm_MemMaxM | Jobhistory JVM最大内存。单位:MB。 |
GcCount | yarn_jobhistory_jvm_GcCount | Jobhistory JVM gc次数。 |
Total GcTime | yarn_jobhistory_jvm_GcTimeMillis | Jobhistory JVM gc时间。单位:ms。 |
YARN-TimelineServer
参数 | 指标 | 描述 |
---|---|---|
MemNonHeapUsedM | yarn_timelineserver_jvm_MemNonHeapUsedM | Timeline Server JVM非堆内存使用。单位:MB。 |
MemNonHeapCommittedM | yarn_timelineserver_jvm_MemNonHeapCommittedM | Timeline Server JVM非堆commit的内存。单位:MB。 |
MemNonHeapMaxM | yarn_timelineserver_jvm_MemNonHeapMaxM | Timeline Server JVM非堆最大可用内存。单位:MB。 |
MemHeapUsedM | yarn_timelineserver_jvm_MemHeapUsedM | Timeline Server JVM堆内存使用。单位:MB。 |
MemHeapCommittedM | yarn_timelineserver_jvm_MemHeapCommittedM | Timeline Server JVM堆内存commit的内存。单位:MB。 |
MemHeapMaxM | yarn_timelineserver_jvm_MemHeapMaxM | Timeline Server JVM堆内存最大可用内存。单位:MB。 |
MemMaxM | yarn_timelineserver_jvm_MemMaxM | Timeline Server JVM最大内存。单位:MB。 |
GcCount | yarn_timelineserver_jvm_GcCount | Timeline Server JVM gc次数。 |
Total GcTime | yarn_timelineserver_jvm_GcTimeMillis | Timeline Server JVM gc时间。单位:ms。 |
GetEntitiesOps | yarn_timeline_GetEntitiesOps | Timeline Server获取批量entities操作数。 |
GetEntitiesTimeAvgTime | yarn_timeline_GetEntitiesTimeAvgTime | Timeline Server获取批量entities平均时间。单位:ms。 |
GetEntityOps | yarn_timeline_GetEntityOps | Timeline Server获取entity操作数。 |
GetEntityTimeAvgTime | yarn_timeline_GetEntityTimeAvgTime | Timeline Server获取entity平均时间。单位:ms。 |
GetEventsOps | yarn_timeline_GetEventsOps | Timeline Server获取批量events操作数。 |
GetEventsTimeAvgTime | yarn_timeline_GetEventsTimeAvgTime | Timeline Server获取批量evnets平均时间。单位:ms。 |
PostEntitiesOps | yarn_timeline_PostEntitiesOps | Timeline Server更新批量entities操作数。 |
PostEntitiesTimeAvgTime | yarn_timeline_PostEntitiesTimeAvgTime | Timeline Server更新批量entities的平均时间。单位:ms。 |
PutDomainOps | yarn_timeline_PutDomainOps | Timeline Server更新Domain操作数。 |
PutDomainTimeAvgTime | yarn_timeline_PutDomainTimeAvgTime | Timeline Server更新Domain平均时间。单位:ms。 |
GetDomainOps | yarn_timeline_GetDomainOps | Timeline Server获取Domain操作数。 |
GetDomainTimeAvgTime | yarn_timeline_GetDomainTimeAvgTime | Timeline Server获取Domain平均时间。单位:ms。 |
GetDomainsOps | yarn_timeline_GetDomainsOps | Timeline Server批量获取Domains操作数。 |
GetDomainsTimeAvgTime | yarn_timeline_GetDomainsTimeAvgTime | Timeline Server批量获取Domains平均时间。单位:ms。 |