ACK兼容阿里云可观测产品,例如云监控、阿里云Prometheus等,并提供丰富的集群监控组件,帮助您全面观测集群健康状况,提前识别并响应问题。本文介绍ACK集群的全链路监控解决方案,包括基础资源、应用、集群、事件、控制面组件、网络以及内核层容器监控。
集群可观测功能
下表介绍ACK集群可观测功能的各个模块及其对应监控能力。
功能模块 | 功能描述 | 文档链接 | 相关组件 |
功能模块 | 功能描述 | 文档链接 | 相关组件 |
基础资源监控 | 通过云监控Kubernetes监控或Prometheus监控功能,您可以查看并监控CPU、内存、网络等基础资源的使用情况及健康状态,提供报警提醒和关键指标监控,确保集群的稳定运行。 | ||
ack-prometheus-operator | |||
应用监控 | 基于阿里云ARMS,通过安装ack-onepilot,实现容器应用的拓扑分析、接口与事务监控、调用链追踪和性能瓶颈检测。 | ||
集群监控 | 阿里云应用监控 eBPF 版为支持无侵入方式获取容器性能数据,快速定位Pod问题,并自动关联至相关服务和控制器工作负载,缩短问题发现时间。 | ||
事件监控 | 结合使用NPD和SLS的Kubernetes事件中心,实现实时监控和通知系统状态,诊断并转换节点异常为事件,支持闭环告警和离线通知。 | ||
控制面组件监控 | 通过Prometheus和Grafana实时监控关键控制面组件(如API Server、etcd、kube-scheduler、kube-controller-manager),支持优化访问和自建Prometheus配置。 | ||
etcd | |||
网络监控 | 集成Ingress日志服务,支持Ingress Dashboard与ARMS联动排查,提供CoreDNS监控和问题解析。在Terway集群中,实现网络流量和业务拓扑的可视化展示,从而实现容器网络和服务可观测性。 | ||
内核层容器监控 | 在操作系统内核层进行容器监控的方法,为集群提供独特的内核层监控和可观测能力,助力容器化部署和迁移。 |
- 本页导读 (1)
- 集群可观测功能