监控管理

更新时间:2025-02-21 10:23:04

ACK兼容阿里云可观测产品,例如云监控、阿里云Prometheus等,并提供丰富的集群监控组件,帮助您全面观测集群健康状况,提前识别并响应问题。本文介绍ACK集群的全链路监控解决方案,包括基础资源、应用、集群、事件、控制面组件、网络以及内核层容器监控。

集群可观测功能

下表介绍ACK集群可观测功能的各个模块及其对应监控能力。

功能模块

功能描述

文档链接

相关组件

功能模块

功能描述

文档链接

相关组件

基础资源监控

通过云监控Kubernetes监控或Prometheus监控功能,您可以查看并监控CPU、内存、网络等基础资源的使用情况及健康状态,提供报警提醒和关键指标监控,确保集群的稳定运行。

基础资源监控

metrics-server

使用阿里云Prometheus监控

ack-arms-prometheus

开源Prometheus监控

ack-prometheus-operator

应用监控

基于阿里云ARMS,通过安装ack-onepilot,实现容器应用的拓扑分析、接口与事务监控、调用链追踪和性能瓶颈检测。

Java应用监控

ack-onepilot

Python应用监控

Golang应用监控

集群监控

阿里云应用监控 eBPF 版为支持无侵入方式获取容器性能数据,快速定位Pod问题,并自动关联至相关服务和控制器工作负载,缩短问题发现时间。

集群拓扑监控

ack-arms-cmonitor

事件监控

结合使用NPDSLSKubernetes事件中心,实现实时监控和通知系统状态,诊断并转换节点异常为事件,支持闭环告警和离线通知。

事件监控

ack-node-problem-detector

控制面组件监控

通过PrometheusGrafana实时监控关键控制面组件(如API Serveretcdkube-schedulerkube-controller-manager),支持优化访问和自建Prometheus配置。

查看集群控制面组件监控大盘

API Server

kube-controller-manager

cloud-controller-manager

kube-scheduler

etcd

网络监控

集成Ingress日志服务,支持Ingress DashboardARMS联动排查,提供CoreDNS监控和问题解析。在Terway集群中,实现网络流量和业务拓扑的可视化展示,从而实现容器网络和服务可观测性。

Ingress Dashboard监控

Nginx Ingress Controller

CoreDNS组件监控

CoreDNS

使用ACKTerwayCiliumHubble实现网络可观测性

Terway网络插件

内核层容器监控

在操作系统内核层进行容器监控的方法,为集群提供独特的内核层监控和可观测能力,助力容器化部署和迁移。

SysOM内核层容器监控

ack-sysom-monitor

  • 本页导读 (1)
  • 集群可观测功能