ADP底座支持GPU能力介绍
一、GPU支持型号信息
1. GPU卡支持情况
Nvidia Tesla家族。
P系列,P100。该系列其他型号理论上支持,但是未验证,暂不推荐。
V系列,V100。
T系列,T4。
A系列,A100,A10,A40,A30,A16。
理论上可以支持老系列:M系列和K系列,但是未验证,所以不推荐。
Nvidia GeForce GTX家族
1080
2080
3080
2. 版本依赖情况
NVIDIA Linux drivers>= 418.81.07
Docker >= 19.03
Kubernetes >= 1.18.0
3. CUDA支持情况
支持CUDA 10.0 11.0
二、GPU驱动
ADP底座不自带nvidia GPU驱动。
主要原因是:nvidia GPU 驱动的授权license,不允许第三方通过预集成的方式打包到第三方的软件中,详见nvidia官方说明。
如果用户需要使用nvidia GPU驱动,可以由用户自己发起,自行安装。安装完GPU驱动之后,ADP底座会自动识别并使用该驱动能力,提供GPU的管理能力。
(识别成功标识:GPU能力成功后,Node的capacity里出现 nvidia.com/gpu 资源,并且数量大于0,如下。)
Capacity:
cpu: 8
ephemeral-storage: 103080204Ki
hugepages-1Gi: 0
hugepages-2Mi: 0
memory: 31747328Ki
nvidia.com/gpu: 1
pods: 110
Allocatable:
cpu: 8
ephemeral-storage: 94998715850
hugepages-1Gi: 0
hugepages-2Mi: 0
memory: 30928128Ki
nvidia.com/gpu: 1
pods: 110