执行集群巡检以发现集群潜在风险并获取解决方案-容器服务 Kubernetes 版 ACK-阿里云

文档备案控制台

输入文档关键字查找

容器智能运维平台提供集群巡检功能，支持扫描集群运行状况，发现集群中存在的潜在风险并提供对应的解决方案，例如云资源配额余量、Kubernetes集群关键资源水位等检查。

操作步骤

在使用集群巡检功能前，请确保集群处于正常运行状态。集群巡检仅保留最近7天的结果。

在容器服务管理控制台的集群列表，查看目标集群的集群状态是否处于运行中。

重要

使用集群巡检功能时，系统将在您的集群中执行数据采集程序并收集检查结果。采集的信息包括系统版本、负载、运行时、kubelet等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。

登录容器服务管理控制台，在左侧导航栏选择集群列表。
在集群列表页面，单击目标集群名称，然后在左侧导航栏，选择巡检和诊断 > 集群巡检。
在集群巡检页面的巡检规则区域，单击添加。
在配置定时巡检规则面板，设置相应的时区和定时规则（每天），仔细确认集群信息和注意事项后，按照页面提示保存配置。
集群定时巡检配置完成后，将按照指定的时间巡检集群。您也可以在集群巡检页面的检查报告列表区域，单击执行巡检检查，手动巡检集群。
巡检完成后，在集群巡检页面的检查报告列表区域右侧的操作列，单击目标检查报告右侧的查看详情。
- 集群巡检会按照触发风险的程度分为低危、中危和高危，并高亮显示。
- 巡检检查报告包含风险级别、风险项名称、异常影响及解决方案。您可以参见控制台指引了解并解决问题。

相关操作

订阅巡检报告

集群巡检支持订阅巡检结果。您可以在集群巡检页面的订阅巡检报告区域，访问智能顾问控制台，配置订阅巡检报告。

管理巡检规则

集群定时巡检配置完成后，您可以在巡检规则区域进行以下操作。

单击编辑，设置新的巡检规则。
单击删除，删除无需使用的巡检规则。规则删除后，集群将不再按此规则巡检。

相关文档

集群检查功能支持在集群升级、迁移等操作前执行检查，确认集群是否符合要求。
集群诊断功能支持节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断等功能，辅助定位集群问题。

上一篇：集群检查项及修复方案下一篇：使用集群诊断

该文章对您有帮助吗？