本文介绍如何通过容器服务提供的集群检查功能快速定位Kubernetes集群和网络的常见问题。

前提条件

  • 已成功创建Kubernetes集群。具体操作,请参见创建Kubernetes托管版集群
  • Kubernetes集群处于正常运行中状态(在集群列表中确认集群状态为运行中)。

适用场景

您只需要单击执行全面检查,无需输入任何参数,就能对您的集群资源、集群组件及集群配置进行全面检查并提供相应建议。建议您定期对集群进行检查和维护。

操作步骤

  1. 登录容器服务管理控制台
  2. 在控制台左侧导航栏中,单击集群
  3. 集群列表页面中,选择目标集群,并在目标集群右侧的操作列下,选择更多 > 集群检查
  4. 容器智能运维左侧导航栏,选择检查 > 全面检查,或单击工具箱区域的全面检查,进入全面检查页面。
    一键检查
    • 集群信息:呈现集群的名称、类型、运行状态、以及最近一次检查的结果。
    • 全面检查:按照时间由近及远的顺序,呈现前5次检查时间及检查结果(如果集群首次执行检查任务,该区域呈现的是执行全面检查,您也可以单击该按钮进入全面检查页面)。
    • 工具箱:提供的集群检查功能,当前全面检查功能已上线,后续将为您提供节点检查等更多集群检查功能。
  5. 单击执行全面检查,在全面检查面板,确认并选中注意事项,单击执行检查,启动集群检查任务。
  6. 您可以看到集群检查的进度,单击查看详情,在检查报告页面,查看集群资源和集群配置的状态。
    检查报告
  7. 已经完成的检查任务,可以根据检查报告提示进行相应处理。
    • 正常:无需处理。
    • 警告:需要确认,引起集群异常的情况需要处理。
    • 异常:尽快处理,避免集群无法正常工作。

    针对单项检查结果,可以单击状态颜色框,查看被检查对象信息及具体检查结果,检查结果包含检查内容、可能影响以及推荐的修复方案,您可以参考影响及修复方案酌情处理。

其他检查

  • 升级检查:集群升级前置检查。
  • 组件检查:组件升级前检查。
  • 迁移检查:专有版集群/标准版集群迁移至Pro版本集群前检查。
  • 定时巡检:定时在集群中执行全面检查。
  • 故障诊断:若通过集群检查的检查报告无法定位节点、Pod及网络的具体故障原因,建议您通过集群故障诊断功能进行故障的诊断修复。具体操作,请参见通过集群故障诊断功能定位集群问题