全部产品

节点管理(阿里云旧版)

更新时间:2020-08-19 09:36:49

说明:本文仅适用于旧版 AKS 集群场景,即在 AKS 集成阿里云容器服务(ACK)之前(2020年8月15号)用户创建的集群。

扩容节点

若节点资源不足,会导致创建工作负载等操作失败。扩容节点即扩容集群内的节点资源。

前提条件

创建集群

操作步骤

  1. 登录容器应用服务控制台,在左侧导航栏点击 集群管理
  2. 在左侧导航栏,点击 节点,进入节点列表页面。
  3. 点击 扩容节点, 进入 扩容节点 页面。
  4. 选择以下扩容方式创建节点:
    • 创建新节点:点击 创建节点,完成以下配置信息并提交,然后设置 Root 密码,点击 提交
      • 可用区:选择节点可用区。
      • 部署单元:所选可用区属于的部署单元。
      • 系列:服务器(ECS)系列。
      • 规格:服务器规格。
      • 系统盘:至少 100 GB。
      • 挂载数据盘:至少 40 GB。
      • 实例数量:服务器数量。
      • 实例名称前缀:实例名称前缀后自动添加序号,生成唯一实例名。实例名称允许包含(小写)字母、数字、连字符、且必须以字母开头、以字母或者数字结尾,2-40 个字符。
      • 登录密码:如遗忘可登录阿里云 ECS 控制台重置密码,参考 重置实例登录密码
    • 使用已有 ECS:将工作空间中已有的处于 运行中 状态的 ECS 加入到容器服务集群。系统会从当前工作空间中筛选出之前以 清除机器环境 方式删除的 ECS,以及从当前工作空间中筛选出由资源管理(RMC)创建的符合条件的 ECS。您可以勾选要添加的 ECS,点击 提交

删除节点

前提条件

创建集群

注意事项

  • 删除节点会引起 Pod 迁移,可能会影响业务,建议在业务低峰期操作。
  • 操作过程中可能存在非预期风险,请提前做好相关的数据备份。

操作步骤

  1. 在左侧导航栏,点击 集群管理 > 节点,进入节点列表页面。

  2. 选择待删除节点,点击 更多操作 > 删除

  3. 在弹出的 删除警告 窗口,选择以下删除方式,点击 确定

    • 清除机器环境:格式化机器磁盘,恢复到服务器创建时的设置。
    • 删除机器:彻底删除服务器。

      说明: 选择 清除机器环境 需重新填写节点的 root 密码。

节点调度

您可以通过控制台界面设置节点调度,从而合理分配各节点的负载。

前提条件

创建集群

暂停调度

节点暂停调度后,在后续进行应用部署时,Pod 不会再调度到该节点。

  1. 登录容器应用服务控制台,在左侧导航栏点击 集群管理

  2. 在左侧导航栏,点击 节点,进入节点列表页面。

  3. 选择节点,点击 更多操作 > 暂停调度,在弹出框中点击 确定

    回到节点列表页,查看节点状态为 不可调度

恢复调度

  1. 登录容器应用服务控制台,在左侧导航栏点击 集群管理

  2. 在左侧导航栏,点击 节点,进入节点列表页面。

  3. 选择节点,点击 更多操作 > 恢复调度,在弹出框中点击 确定

    回到节点列表页,查看节点状态为 可调度

管理标签

节点标签可以给节点定义不同的属性,通过这些标签可以快速的了解各个节点的特点,便于节点的管理和工作负载的调度。

前提条件

创建集群

添加标签

  1. 登录容器应用服务控制台,在左侧导航栏点击 集群管理

  2. 在左侧导航栏,点击 节点,进入节点列表页面。

  3. 选择节点,点击 更多操作 > 编辑标签

  4. 添加标签 页面,点击 添加标签,输入变量名和值,点击 提交

删除标签

删除标签只能够删除用户自定义的标签,节点固有的标签不能删除。

  1. 登录容器应用服务控制台,在左侧导航栏点击 集群管理

  2. 在左侧导航栏,点击 节点,进入节点列表页面。

  3. 选择节点,点击 更多操作 > 编辑标签

  4. 添加标签 页面,点击标签右侧的 删除,点击 提交

管理 Taint

前提条件

创建集群

添加 Taint

  1. 登录容器应用服务控制台,在左侧导航栏点击 集群管理

  2. 在左侧导航栏,点击 节点,进入节点列表页面。

  3. 选择节点,点击 更多操作 > 编辑 Taint

  4. 在 Taint 列表中,点击 添加 Taint,在弹出框中输入 变量名,选择 Effect,点击 确定
    Effect 包含以下选项:

    • NoSchedule:不允许无匹配 toleration 的 Pod 调度到该节点。
    • NoExecute:若无匹配 toleration 的 Pod 已经在节点上运行,则将 Pod 驱逐,若无匹配 toleration 的 Pod 尚未在节点上运行,则不会将 Pod 调度到该节点上。
    • PreferNoSchedule:尽量不将无匹配 toleration 的 Pod 调度到该节点。

更多详情参见 官方文档

删除 Taint

  1. 登录容器应用服务控制台,在左侧导航栏点击 集群管理

  2. 在左侧导航栏,点击 节点,进入节点列表页面。

  3. 选择节点,点击 更多操作 > 编辑 Taint

  4. 在 Taint 列表中,点击 taint 右侧的 删除,点击 提交

查看节点详情

前提条件

创建集群

操作步骤

  1. 登录容器应用服务控制台,在左侧导航栏点击 集群管理

  2. 集群详情 页的 节点列表 中,点击 节点名称 进入节点详情页面。

    您可以查看以下信息。

    信息模块

    内容

    基本信息

    节点名称

    系统信息:节点服务器的处理器、内核版本、操作系统、系统镜像。

    节点服务器 IP

    节点的创建时间

    系统定义的节点标签,可用于节点分组。

    机器详情:点击详情链接跳转至工作空间资源管理页面查看 ECS 详情。

    注释:系统注释信息

    调度状态:

    分为可调度与不可调度状态。

    使用详情

    CPU 分配:节点的 CPU 使用率

    例如:CPU 为两核,实际使用了 1 核,则 CPU 使用率为 50%。

    内存分配:节点的内存使用率

    例如:内存总量为 10 GiB,实际使用了 5 GiB,则内存使用率为 50%。

    容器使用情况:节点中容器的使用率

    例如:节点中一共有两个容器,实际使用了一个容器,则使用率为 50%。
    Pod 列表 节点所包含的容器列表,包括容器名称、IP、命名空间、 状态、创建时间。
    节点事件 反映节点生命周期和运行状况的事件日志,包含事件类型、事件原因、实践内容。
    事件类型分为 Normal、Warning、Error。您可以查看 Warning 和 Error 类型事件进行故障排查。
    节点监控 监控节点的 CPU、 memory、磁盘使用率等信息。