使用GPU实例
ECIGPU实例内置了显卡设备驱动及CUDA驱动,因此运行ECIGPU实例只需使用内置了CUDAToolkit等软件的基础镜像即可,无需关心驱动安装。本文介绍如何使用ECI GPU实例。
背景信息
当前ECI GPU支持的驱动版本为NVIDIA 460.73.01,可支持的CUDA Tookit版本为11.2。关于CUDAToolkit的更多信息,请参见NVIDIA CUDA。
ECI支持通过指定ECS GPU规格来创建ECI GPU实例。支持的ECS GPU规格,如下所示:
- GPU计算型实例规格族gn6v(NVIDIA V100),例如:ecs.gn6v-c8g1.2xlarge。
- GPU计算型实例规格族gn6i(NVIDIA T4),例如:ecs.gn6i-c4g1.xlarge。
- GPU计算型实例规格族gn5(NVIDIA P100),例如:ecs.gn5-c4g1.xlarge。
- GPU计算型实例规格族gn5i(NVIDIA P4),例如:ecs.gn5i-c2g1.large。
关于完整的ECS GPU规格定义,请参见实例规格族。
使用方法
在Pod定义中增加annotations: k8s.aliyun.com/eci-use-specs
,具体示例如下。
- 在Pod的
metadata
中添加指定规格的annotations
。 - 在Container的
resources
中声明GPU资源。
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx-gpu-demo
labels:
app: nginx
spec:
replicas: 2
selector:
matchLabels:
app: nginx
template:
metadata:
labels:
app: nginx
annotations:
k8s.aliyun.com/eci-use-specs: ecs.gn5i-c4g1.xlarge
spec:
containers:
- name: nginx
image: registry-vpc.cn-beijing.aliyuncs.com/eci_open/nginx:1.15.10
resources:
limits:
nvidia.com/gpu: '1'
ports:
- containerPort: 80