控制台访问集群异常问题排查

本文介绍容器计算服务 ACS(Container Compute Service)控制台访问集群异常问题的现象、问题原因和解决方案。主要问题包括:当前集群API Server请求异常、访问容器组日志时报错API Server请求异常、当前账号未被授予该操作所需的集群RBAC权限和当前账号未被授予该操作所需的RAM权限。

当前集群APIServer请求异常

问题现象

当您在控制台访问集群资源时,出现报错“当前集群APIServer请求异常”,错误码:ErrorQueryClusterNamespaceAPIServer.50088

问题原因

由API Server负载均衡配置或者状态异常导致容器计算服务管控与集群API Server之间连接失败。

解决方案

  1. 登录容器计算服务控制台,在左侧导航栏选择集群

  2. 集群列表页面中,单击目标集群。

  3. 在集群管理页,单击集群资源页签,然后单击API Server 负载均衡(SLB)后面的链接,跳转到负载均衡管理控制台

    • 如果界面提示负载均衡ID不存在,则说明API Server的负载均衡实例被删除或释放。集群不可恢复,您需要重新创建集群。详细信息,请参见创建ACS集群

    • 否则,继续执行下一步。

  4. 查看该负载均衡实例的状态是否为运行中

    • 如果否,检查实例是否处于欠费停止(按量付费实例)或到期锁定状态(包年包月实例)。请先完成续费,然后重新启用实例。关于负载均衡的欠费说明,请参见欠费说明

    • 如果是,继续执行下一步。

  5. 查看该负载均衡实例的监听,确认前端和后端是否均存在TCP:6443的监听,且运行状态是否为运行中123

    • 如果否,说明API Server负载均衡监听被修改。

      • 若监听存在,但处于停止状态,请选择该项监听,然后单击启动

      • 若监听不存在,请提交工单咨询。

    • 如果是,继续执行下一步。

  6. 查看上述监听的健康检查状态是否为正常

    • 如果否,则说明API Server的负载均衡后端异常。请提交工单咨询。

    • 如果是,继续执行下一步。

  7. 查看上述监听是否启用了访问控制。

    • 如果是,则说明API Server的负载均衡监听访问控制白名单未正确配置。在访问控制策略中将地址段100.104.0.0/16添加到白名单,该地址段为ACS管控内部访问API Server的请求来源地址段。有关访问控制的详细信息,请参见访问控制

    • 如果否,继续执行下一步。

  8. 若以上均不符合,请提交工单咨询。

访问容器组日志时报错API Server请求异常

若您在查看容器组日志时遇到该问题,而集群其他资源均可正常访问,您可以按以下步骤排查。

  1. 查看容器组运行状态是否为Running,若不是,请参见Pod异常问题排查

  2. 检查所有安全组规则,确认是否开放了来自VPC私网、目标端口为TCP/10250的入方向访问,若未开放,请添加上述安全组规则。详细信息,请参见添加安全组规则

  3. 若以上均不符合,请提交工单咨询。

当前账号未被授予该操作所需的集群RBAC权限

问题现象

当您访问控制台时,出现报错“当前账号未被授予该操作所需的集群RBAC权限”,错误码:ForbiddenQueryClusterNamespaceAPISERVER.40391

问题原因

您使用的账号未被授予当前操作所需的集群RBAC权限。

解决方案

  1. 使用阿里云账号或者具有管理员权限的账号登录容器计算服务控制台,在左侧导航栏中选择授权管理

  2. RAM用户页签查找出现报错的用户名,单击用户名右侧的管理权限

  3. 权限管理页面,单击添加权限,选择对应集群、命名空间和权限管理,单击提交授权

当前账号未被授予该操作所需的RAM权限

问题现象

当您访问控制台时,出现报错“当前账号未被授予该操作所需的RAM权限”,错误码:StatusForbidden85

问题原因

您使用的账号未被授予当前操作所需的RAM权限。

解决方案

  1. 使用阿里云账号或者具有RAM权限的账号登录RAM管理控制台

  2. 根据错误提示页面的CS信息为您的账号添加相应的授权,例如cs:DescribeKubernetesVersionMetadata。详细操作,请参见为RAM用户或RAM角色授予RAM权限