ADP底座支持GPU能力介绍

更新时间: 2022-06-27 10:55:59

一、GPU支持型号信息

1. GPU卡支持情况

Nvidia Tesla家族。

    • P系列,P100。该系列其他型号理论上支持,但是未验证,暂不推荐。

    • V系列,V100。

    • T系列,T4。

    • A系列,A100,A10,A40,A30,A16。

    • 理论上可以支持老系列:M系列和K系列,但是未验证,所以不推荐。

Nvidia GeForce GTX家族

    • 1080

    • 2080

    • 3080

2. 版本依赖情况

NVIDIA Linux drivers>= 418.81.07

Docker >= 19.03

Kubernetes >= 1.18.0

3. CUDA支持情况

支持CUDA 10.0 11.0

二、GPU驱动

ADP底座不自带nvidia GPU驱动。

主要原因是:nvidia GPU 驱动的授权license,不允许第三方通过预集成的方式打包到第三方的软件中,详见nvidia官方说明

如果用户需要使用nvidia GPU驱动,可以由用户自己发起,自行安装。安装完GPU驱动之后,ADP底座会自动识别并使用该驱动能力,提供GPU的管理能力。
(识别成功标识:GPU能力成功后,Node的capacity里出现 nvidia.com/gpu 资源,并且数量大于0,如下。)
Capacity:
  cpu:                   8
  ephemeral-storage:     103080204Ki
  hugepages-1Gi:         0
  hugepages-2Mi:         0
  memory:                31747328Ki
  nvidia.com/gpu:        1
  pods:                  110
Allocatable:
  cpu:                   8
  ephemeral-storage:     94998715850
  hugepages-1Gi:         0
  hugepages-2Mi:         0
  memory:                30928128Ki
  nvidia.com/gpu:        1
  pods:                  110
阿里云首页 云原生应用交付平台 相关技术圈