全部产品
云市场

节点(阿里云版)

更新时间:2020-04-01 11:27:50

说明:该文档内容仅适用于公共云(或阿里云底座的专有云)上的 AKS 产品。

扩容节点

若节点资源不足,会导致创建工作负载等操作失败。扩容节点即扩容集群内的节点资源。

前提条件

创建集群

操作步骤

  1. 登录容器应用服务控制台,在左侧导航栏点击 集群管理
  2. 在左侧导航栏,点击 节点,进入节点列表页面。
  3. 点击 扩容节点, 进入 扩容节点 页面。
  4. 选择以下扩容方式:
    • 创建新节点:点击 创建节点,完成以下配置信息并提交,然后设置 Root 密码,点击 确定
      • 可用区:选择节点可用区。
      • 部署单元:所选可用区属于的部署单元。
      • 系列:服务器(ECS)系列。
      • 规格:服务器规格。
      • 系统盘:至少 100 GB。
      • 挂载数据盘:至少 40 GB。
      • 实例数量:服务器数量。
      • 实例名称前缀:实例名称前缀后自动添加序号,生成唯一实例名。实例名称允许包含(小写)字母、数字、连字符、且必须以字母开头、以字母或者数字结尾,2-80 个字符。
      • 登录密码:若遗忘可登录 ECS 控制台重置密码。
    • 使用已有节点:将工作空间中已有的处于 运行中 状态的 ECS 加入到容器服务集群。系统会从当前工作空间中筛选出之前以 清除机器工作空间 方式删除的 ECS。您可以勾选要添加的 ECS,点击 创建
  5. 在弹出的 开发者预览 页面,点击 确定

删除节点

前提条件

创建集群

注意事项

  • 删除节点会引起 Pod 迁移,可能会影响业务,建议在业务低峰期操作。
  • 操作过程中可能存在非预期风险,请提前做好相关的数据备份。

操作步骤

  1. 在配置了 kubeconfig 的 ECS 服务器上执行以下命令,把待移除节点上的 Pod 转移到其他节点。

    说明:需确保集群其他节点的资源充足。

    1. kubectl drain node-ID

    重要:命令中必须使用 node ID,不能使用 node name。 可以使用kubectl get nodes命令查看 node ID。

    getnodes

  2. 设置待移除节点为暂停调度。参考 节点调度

  3. 在左侧导航栏,点击 集群管理 > 节点,进入节点列表页面。

  4. 选择待删除节点,点击 更多操作 > 删除

  5. 在弹出的 删除警告 窗口,选择以下删除方式,点击 确定

    • 清除机器工作空间:格式化机器磁盘,恢复到服务器创建时的设置。
    • 删除机器:彻底删除服务器。

      说明

      • 选择 清除机器工作空间 需重新填写节点的 root 密码。
      • 对于包年包月的服务器,只能选择清除机器工作空间的方式,无法直接删除服务器。

节点调度

您可以通过控制台界面设置节点调度,从而合理分配各节点的负载。

前提条件

创建集群

暂停调度

节点暂停调度后,在后续进行应用部署时,Pod 不会再调度到该节点。

  1. 登录容器应用服务控制台,在左侧导航栏点击 集群管理

  2. 在左侧导航栏,点击 节点,进入节点列表页面。

  3. 选择节点,点击 更多操作 > 暂停调度,在弹出框中点击 确定

    回到节点详情页,查看节点状态为 暂停调度

恢复调度

  1. 登录容器应用服务控制台,在左侧导航栏点击 集群管理

  2. 在左侧导航栏,点击 节点,进入节点列表页面。

  3. 选择节点,点击 更多操作 > 恢复调度,在弹出框中点击 确定

    回到节点详情页,查看节点状态为 可调度

管理标签

节点标签可以给节点定义不同的属性,通过这些标签可以快速的了解各个节点的特点,便于节点的管理和工作负载的调度。

前提条件

创建集群

添加标签

  1. 登录容器应用服务控制台,在左侧导航栏点击 集群管理

  2. 在左侧导航栏,点击 节点,进入节点列表页面。

  3. 选择节点,点击 更多操作 > 编辑标签

  4. 添加标签 页面,点击 添加标签,输入变量名和值,点击 提交

删除标签

删除标签只能够删除用户自定义的标签,节点固有的标签不能删除。

  1. 登录容器应用服务控制台,在左侧导航栏点击 集群管理

  2. 在左侧导航栏,点击 节点,进入节点列表页面。

  3. 选择节点,点击 更多操作 > 编辑标签

  4. 添加标签 页面,点击标签右侧的 删除

管理 Taint

前提条件

创建集群

添加 Taint

  1. 登录容器应用服务控制台,在左侧导航栏点击 集群管理

  2. 在左侧导航栏,点击 节点,进入节点列表页面。

  3. 选择节点,点击 更多操作 > 编辑 Taint

  4. 在 Taint 列表中,点击 添加 Taint,在弹出框中输入 变量名,选择 Effect,点击 确定
    Effect 包含以下选项:

    • NoSchedule:不允许无匹配 toleration 的 Pod 调度到该节点。
    • NoExecute:若无匹配 toleration 的 Pod 已经在节点上运行,则将 Pod 驱逐,若无匹配 toleration 的 Pod 尚未在节点上运行,则不会将 Pod 调度到该节点上。
    • PreferNoSchedule:尽量不将无匹配 toleration 的 Pod 调度到该节点。

更多详情参见 官方文档

删除 Taint

  1. 登录容器应用服务控制台,在左侧导航栏点击 集群管理

  2. 在左侧导航栏,点击 节点,进入节点列表页面。

  3. 选择节点,点击 更多操作 > 编辑 Taint

  4. 在 Taint 列表中,点击 taint 右侧的 删除

查看节点详情

前提条件

创建集群

操作步骤

  1. 登录容器应用服务控制台,在左侧导航栏点击 集群管理

  2. 集群详情 页的 节点列表 中,点击 节点名称 进入节点详情页面。

    您可以查看以下信息。

    信息模块

    内容

    基本信息

    节点名称

    系统信息:节点服务器的处理器、内核版本、操作系统、系统镜像。

    节点服务器 IP

    节点的创建时间

    系统定义的节点标签,可用于节点分组。

    机器详情:点击详情链接跳转至工作空间资源管理页面查看 ECS 详情。

    注释:系统注释信息

    调度状态:

    分为可调度与不可调度状态。

    使用详情

    CPU 分配:节点的 CPU 使用率

    例如:CPU 为两核,实际使用了 1 核,则 CPU 使用率为 50%。

    内存分配:节点的内存使用率

    例如:内存总量为 10 GiB,实际使用了 5 GiB,则内存使用率为 50%。

    容器使用情况:节点中容器的使用率

    例如:节点中一共有两个容器,实际使用了一个容器,则使用率为 50%。
    Pod 列表 节点所包含的容器列表,包括容器名称、IP、命名空间、 状态、创建时间。
    节点事件 反映节点生命周期和运行状况的事件日志,包含事件类型、事件原因、实践内容。
    事件类型分为 Normal、Warning、Error。您可以查看 Warning 和 Error 类型事件进行故障排查。
    节点监控 监控节点的 CPU、 memory、磁盘使用率等信息。