随着容器技术的发展与使用,大量的业务运行于容器中,使得容器技术越来越离不开对容器本身的监控。ARMS容器监控能够对阿里云容器服务Kubernetes版的节点机器上的资源及容器进行实时监控和性能数据采集,并进行可视化展示,为您提供容器化环境端到端的监控排查路径。

产品功能

容器监控自动获取当前账号下的阿里云容器服务Kubernetes版集群信息,能够基于Prometheus监控数据、集群事件持久化数据以及集群的基本配置信息提供以下功能。

异常Pod检测

异常Pod是指:

  • 频繁重启的Pod
  • 网络流量不均的Pod
  • 未设置Limit资源但实际占用资源较多的Pod
  • 实际占用资源较少但设置Request较大的Pod
  • 有驱逐风险的Pod以及其他异常Pod

容器监控提供异常Pod检测功能,通过Pod资源配置、资源使用分布情况和历史异常事件预估和展示当前集群中可能有风险的Pod,并帮助您降低其风险。

pg_docker_node

资源使用情况可视化

容器监控提供集群资源监控功能,帮助您快速查看集群内Pod的健康状态、Pod的CPU和内存资源的使用情况。

sc_docker_pod_status

Deployment监控

ARMS容器监控提供Deployment监控,主要监控应用运行时对环境的依赖情况,包括CPU以及内存的监控。

Pod监控

ARMS容器监控还提供集群中运行的所有Pod状态以及Pod本身的监控,Pod本身的监控包括事件监控、生命周期监控、资源监控以及日志监控:

  • 事件监控是监控集群的事件信息,例如告警和错误事件等。

    Kubernetes的架构设计是基于状态机的,不同的状态之间进行转换则会生成相应的事件,正常的状态之间转换会生成Normal等级的事件,正常状态与异常状态之间的转换会生成Warning等级的事件。您可以通过获取事件,实时诊断集群的异常与问题。

  • 生命周期监控

    生命周期监控可以帮助您随时掌握Pod在整个生命周期的各个状态,以便您更好地调度和管理Pod。

    Timeline Monitor
  • 资源监控

    通过资源监控可以快速查看负载的CPU、内存、网络等指标的使用率。

    Resource Monitor
  • 日志监控

    日志监控展示Pod实时监控日志,方便您进行问题诊断。

    Log Detail Monitor

应用性能监控

对于部署在容器服务Kubernetes版集群中的应用,您可以使用ARMS应用监控对其监控,详情请参见准备工作概述。安装应用监控探针后,可将容器与应用关联,即将容器的CPU、内存和网络资源使用情况,以及集群异常事件和日志等信息与应用关联,帮助您排查当前容器环境是否会对您的业务产生影响。