节点操作概述

本文汇总容器服务管理控制台支持的管理Worker节点的常见操作。您可以参见本文了解操作方式及相关注意事项。

大部分操作可在节点页面执行。

  1. 登录容器服务管理控制台,在左侧导航栏选择集群列表

  2. 集群列表页面,单击目标集群名称,然后在左侧导航栏,选择节点管理 > 节点

节点登录

在节点故障排除、节点性能监控、执行自定义脚本等场景下,您可以登录节点对应的ECS实例。

  • Workbench连接:在节点列表的操作列,选择更多 > Workbench 远程连接

  • VNC连接:在节点列表的操作列,选择更多 > VNC 远程连接

更多ECS实例远程连接的方式,请参见ECS远程连接方式概述

说明

如果您的操作系统为ContainerOS,为了减少潜在的安全风险,ContainerOS原则上不支持任何用户直接登录到系统进行一系列可能无法追溯的操作,也不提供SSH登录功能。若您仍然有登录实例进行运维操作的需求,请参见ContainerOS运维容器使用指导

节点排水和调度状态

节点排水

在节点列表的操作列,选择更多 > 节点排水,按照页面提示完成节点排水,即排空节点上的已有Pod,然后将节点标识为不可调度状态, 后续新建Pod不会再调度到该节点。

请关注以下注意事项。

  • 确保集群其他节点的资源充足,以避免业务Pod无法调度。

  • 检查待移除节点上的Pod的节点亲和性规则和调度策略,确保Pod不会因为节点移除而无法调度到其他节点。

  • DaemonSet控制的Pod不会被排空。

更改节点调度状态

在节点列表,勾选目标节点, 然后单击页面下面的设置调度状态,仔细阅读对话框的注意事项后,按照页面提示完成操作。

请关注以下注意事项。

  • 此操作可能会对业务产生影响,建议在业务低峰期进行。

  • 将节点设置为不可调度后,节点会被标识为SchedulingDisabled。节点上已有的Pod继续对外提供服务,但后续新建的Pod不会再调度到该节点。

  • DaemonSet控制的Pod不会被排空。

节点移除

当您不再需要某Worker节点继续工作时,可以在业务低峰期通过容器服务管理控制台将节点从节点池或集群中移除。在节点列表的操作列,选择更多 > 移除或勾选节点后在页面下方单击批量移除,并按照页面提示完成操作。

相关注意事项和功能介绍,请参见移除节点

节点监控

在节点列表的操作列,单击监控,按照页面提示安装组件并启用阿里云Prometheus,查看节点资源监控大盘。关于基于阿里云Prometheus监控配置监控告警的更多信息,请参见(可选)步骤三:配置Prometheus监控告警

关于如何实现在节点状态异常时自定义PromQL来创建告警规则,请参见节点状态异常

节点故障诊断

在节点列表的操作列,单击异常节点对应的故障诊断,进行节点检查并获取对应的修复方案。关于支持诊断的异常场景、诊断的检查项及其修复方案,请参见节点诊断

管理节点标签和污点

如需通过标签(Labels) 和污点(Taints) 管理和调度集群中的资源,可在节点页面,单击标签与污点管理,然后按照页面指引完成标签名称和值的配置,请参见管理节点标签和污点

节点批量运维

如需批量运维ACK集群中的Worker节点,例如安全更新操作系统内核,安装自定义的监控、安全、审计软件包等,可在节点列表勾选需要批量运维的节点,在页面下方单击批量运维,然后按照控制台指引完成操作。详细信息,请参见批量运维节点

查看节点信息

在节点列表的操作列,选择更多 > 查看YAML,查看节点YAML信息。

在节点列表的操作列,选择更多 > 详情,查看节点信息。

  • CPU和内存使用量

    • CPU请求量 = SUM(当前节点上所有PodCPU请求值)/ 节点可分配的CPU

    • CPU使用量 = SUM(当前节点上所有PodCPU实际使用量)/ 节点可分配的CPU

    • 内存请求量= SUM(当前节点上所有Pod的内存请求值)/ 节点可分配的内存

    • 内存使用量 = SUM(当前节点上所有Pod的内存实际使用量)/ 节点可分配的内存

    说明

    节点可分配资源(Allocatable) = 总资源(Capacity)-预留资源(Reserved)-驱逐阈值(Eviction-Threshold)。更多信息,请参见节点资源预留策略

  • 节点基本信息

    节点名称、IP地址、实例ID、容器运行时版本、操作系统及内核等。

  • 其他

    节点CPU和内存资源的分配情况(RequestLimit)、节点状态、Pod列表、节点Event等。

相关文档

  • 您可以使用ACK提供的资源画像功能,基于资源使用量的历史数据获得容器粒度的资源规格推荐,简化为容器配置RequestLimit的复杂度。更多信息,请参见资源画像

    关于如何配置业务Pod所需资源的具体操作,请参见创建无状态工作负载Deployment

  • 通过设置节点标签和nodeSelector策略,您可以将应用调度到指定节点上。详细信息,请参见调度应用至指定节点

  • 关于如何升降配Worker节点资源,请参见升降配节点资源

  • 关于如何为节点添加数据盘,存储容器运行时、kubelet等资源,请参见为节点添加数据盘

  • 关于如何实现数据盘、系统盘的扩容,请参见扩容节点系统盘

  • 节点的升级(kubelet版本和运行时版本)在节点池维度进行,请参见升级节点池