查看集群信息

容器服务 Kubernetes 版集群提供集群信息页面,展示集群基本信息、巡检信息、相关云资源、集群资源监控等。本文介绍如何查看集群信息以及集群信息项。

操作入口

  1. 登录容器服务管理控制台,在左侧导航栏选择集群

  2. 集群列表页面,单击目标集群名称,然后在左侧导航栏,选择集群信息

  3. 单击不同页签,查看不同维度信息。

    具体内容,请参见集群信息内容

集群信息内容

页签

说明

概览

选择所需的命名空间,查看应用状态、组件状态和资源监控图表等内容。

  • 应用状态:显示当前运行的部署、容器组、有状态副本集等应用状态的示意图,绿色图标代表正常,黄色图标代表异常。

  • 节点状态:显示当前集群的节点状态。

  • 集群风险预警:自动扫描Kubernetes集群,提示您潜在的风险和对应的解决方案,防止您的业务受损。您可以通过配置集群巡检设定扫描时间和扫描周期。

  • 事件:显示集群的事件信息,例如警告和错误事件等。

  • 资源监控:提供CPU和内存的监控图表。CPU统计单位为Cores(核),可显示小数点后3位,最小统计单位是millicores,即一个核的1/1000;内存的统计单位是Gi,显示小数点后3位。更多相关信息,请参见Meaning of CPUMeaning of memory

安全概览

单击安全概览,对集群的安全配置进行巡检后,此概览页签将展示集群配置巡检扫描结果,包括节点漏洞、容器镜像风险、容器运行时风险等,帮助您实时了解当前集群中运行应用的配置是否存在安全隐患。

巡检结果支持以报表化的方式展示,同时展示巡检对应扫描项的说明和修复建议。您还可以配置定期巡检,对应的扫描结果会写入到SLS指定的日志库中存储。具体操作,请参见配置巡检检查集群工作负载

该功能目前仅支持ACK集群Pro版,白名单开放中,请提交工单申请。

基本信息

  • 基本信息:关于集群的基本信息,例如集群ID、地域、集群时区、Kubernetes版本、是否开启删除保护等。

  • 网络:关于集群网络的信息,例如容器网络插件、虚拟交换机、API Server端点、Service网段等。

  • 安全与审计:集群安全与审计信息,例如Secret落盘加密、审计日志等。

  • 集群资源:集群所用ROS资源栈、日志服务Project等信息。

  • 标签分组:集群的资源组和标签。

连接信息

获取公网和内网环境下KubeConfig文件的配置内容,用于配置通过Kubectl客户端访问集群。

集群监控

对接阿里云可观测监控 Prometheus 版,对集群进行资源监控,支持快速查看负载的CPU、内存、网络等指标的使用率,带来更专业的监控与报警能力和更合适的容器场景指标。更多信息,请参见监控管理

成本概览

启用成本洞察功能后,支持查看指定财务治理周期内,指定集群、部门、应用的成本和资源使用情况,满足多种场景的成本估算、分摊与核算的需求。更多信息,请参见成本洞察概述

集群日志

集群的运行日志。

集群任务

查看集群任务、任务状态、涉及资源、变更时间等。失败任务将提示失败信息,协助问题的排查和诊断。

运维任务

仅针对托管节点池。可参见创建节点池开启,使用其提供的自动化运维能力。

查询ACK自动运维任务生成的执行计划,例如ECS主动运维事件响应、节点池kubelet自动升级、CVE漏洞自动修复。

ECS主动运维事件介绍

托管节点池支持ECS计划内运维事件重启Reboot类型事件)的响应和修复。如果节点池在ECS设定的重启时间前有可用的运维窗口,ACK会在运维窗口内通过排水和实例重启来响应该事件。否则,ACK会在重启时间的前一个小时响应该事件。具体执行流程如下。

  1. 接收并响应ECS重启事件,同步发送短信或站内信通知。请及时关注。

  2. 针对受影响的ECS实例执行节点排水,将节点上Pod迁移到其他可用的节点。

    排水操作会驱逐节点上的Pod。服务应用后端应采用多副本部署在多个节点上,同时建议为重要应用配置PDB,以避免节点上Pod被驱逐后影响服务的整体可用性。

  3. 重启ECS实例。

    若排水失败,ACK不会尝试强制重启实例。