添加GPU节点

ACK Edge集群的边缘节点池支持管理线下GPU资源。本文介绍如何在ACK Edge集群中的边缘节点池中添加GPU节点。

前提条件

使用限制

  • 请确保您的集群配额充足。如需添加更多节点,请到配额平台提交申请扩大配额。关于ACK Edge集群的配额限制,请参见配额与限制

  • 添加GPU节点时会访问部分域名地址,需要节点侧网络安全组放开限制允许访问。具体信息,请参见节点接入访问域名和IP路由网段配置

  • 添加GPU节点时,需要选择以下支持的GPU型号。GPU节点如何接入,请参见操作步骤。如果有其他GPU型号需求,请提交工单处理。

    系统架构

    GPU型号

    边缘Kubernetes集群版本

    AMD64/x86_64

    Nvidia_Tesla_T4

    ≥1.16.9-aliyunedge.1

    AMD64/x86_64

    Nvidia_Tesla_P4

    ≥1.16.9-aliyunedge.1

    AMD64/x86_64

    Nvidia_Tesla_P100

    ≥1.16.9-aliyunedge.1

    AMD64/x86_64

    Nvidia_Tesla_V100

    ≥1.18.8-aliyunedge.1

    AMD64/x86_64

    Nvidia_Tesla_A10

    ≥1.20.11-aliyunedge.1

    AMD64/x86_64

    Nvidia_L40

    ≥1.26.3-aliyun.1

操作步骤

  1. 登录容器服务管理控制台,在左侧导航栏选择集群

  2. 集群列表页面,单击目标集群名称,然后在左侧导航栏,选择节点管理 > 节点池

  3. 节点池页面,选择目标节点池右侧操作列的更多 > 添加已有节点

  4. 进入添加节点页面,单击手动添加,添加现有实例。

  5. 单击下一步进入实例信息页面,您可以在此处填写节点接入配置,具体的配置参数,请参见参数列表

    image

    说明
    • 生成节点接入脚本时,需配置gpuVersion参数。当前支持的GPU版本如下请参见使用限制

    • 该参数配置完成后,接入工具会自动安装nvidia-containerd-runtime,关于nvidia-containerd-runtime更多信息,请参见nvidia-containerd-runtime

  6. 配置完成后单击下一步,进入添加完成页面,单击复制,到您的边缘节点上粘贴并执行该脚本。

    添加节点成功的结果如下图所示。

    接入成功

相关文档

  • 如果您在添加边缘节点时遇到问题,请参见诊断边缘节点问题

  • 如果您需要移除不使用的边缘节点,请参见移除边缘节点

  • 如果您需要实现边缘节点的自主管理,当云边网络断开时,边缘节点上的业务仍然可以持续稳定地运行。具体操作,请参见设置边缘节点自治