全部产品
云市场
    Kubernetes管控集群链路异常的排查思路

Kubernetes管控集群链路异常的排查思路

更新时间:2020-01-09 18:55:17

问题描述

Kubernetes管控集群链路异常,访问容器服务管理控制台超时,并提示如下错误。

{842748B1-0D7B-4B6E-B399-6E317DF0A0F2}_20200106145317.png

 

问题原因

访问容器服务控制台超时,可能是以下几种原因所造成。

  • SLB实例被误删除。
  • 内网SLB配置了ACL规则。
  • 专有版Kubernetes集群Master节点被误删除。
  • 专有版Kubernetes集群Master节点的安全组配置了白名单。

 

解决方案

  1. 登录到Kubernetes集群的节点,详情请参见通过kubectl连接Kubernetes集群
    kubectl get ns
    如下图所示为正常结果。
    {1AD2BB27-D12A-43F8-9584-2E0B84908FFF}_20200106151113.jpg
    注:
    • 返回结果为正常,则执行步骤2。
    • 若返回结果异常或为空,则为集群内部问题。请执行步骤3。
  2. 登录容器服务管理控制台,单击左侧导航栏中的 命名空间,查看命名空间是否显示正常。
    如下图所示表示命名空间显示异常。
    9.png
    注:
    • 命名空间页面正常,说明管控链路正常,请结束操作。
    • 命名空间页面异常,请执行步骤4。
  3. 在容器服务管理控制台中,单击左侧导航栏中的 概览,查看概览页面是否显示正常。
    如下图所示表示无法查看节点状态。
    p63731.png
    注:
    • 在概括页面中可以查看节点状态、组件状态、warning事件,请根据提示信息进行修复。
    • 或者在节点上执行kubectl命令,查询节点和组件状态。
    • 如果以上操作仍然不能解决该问题,请继续执行下一步操作。
  4. 登录SLB控制台,单击左侧导航栏中的 实例 > 实例管理,单击目标实例。
  5. 单击 监听,查看监听端口是否为6443,则表示监听端口正确。

  6. 单击 默认服务器组,查看公网和内网的SLB是否正确,如下图所示表示公网和内网SLB显示正确。
  7. 单击 监听,在操作列选择 更多 > 访问控制设置,查看访问控制设置是否正确。如下图所示,访问控制未启用。
    p64261.png
    或者启用访问控制,且100.104.0.0/16网段已加入白名单,均设置正确。
    p63736.png
    注:如果以上配置不正确,请参考示例截图进行配置。

     

    适用于

    • 容器服务 Kubernetes 专有版
    • 容器服务 Kubernetes 托管版