使用GPU实例

更新时间: 2023-07-10 12:21:42

ECIGPU实例内置了显卡设备驱动及CUDA驱动,因此运行ECIGPU实例只需使用内置了CUDAToolkit等软件的基础镜像即可,无需关心驱动安装。本文介绍如何使用ECI GPU实例。

背景信息

当前ECI GPU支持的驱动版本为NVIDIA 460.73.01,可支持的CUDA Tookit版本为11.2。关于CUDAToolkit的更多信息,请参见NVIDIA CUDA

ECI支持通过指定ECS GPU规格来创建ECI GPU实例。支持的ECS GPU规格,如下所示:

  • GPU计算型实例规格族gn6v(NVIDIA V100),例如:ecs.gn6v-c8g1.2xlarge。
  • GPU计算型实例规格族gn6i(NVIDIA T4),例如:ecs.gn6i-c4g1.xlarge。
  • GPU计算型实例规格族gn5(NVIDIA P100),例如:ecs.gn5-c4g1.xlarge。
  • GPU计算型实例规格族gn5i(NVIDIA P4),例如:ecs.gn5i-c2g1.large。

关于完整的ECS GPU规格定义,请参见实例规格族

使用方法

在Pod定义中增加annotations: k8s.aliyun.com/eci-use-specs,具体示例如下。

  • 在Pod的metadata中添加指定规格的annotations
  • 在Container的resources中声明GPU资源。
apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-gpu-demo
  labels:
    app: nginx
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
      annotations:
        k8s.aliyun.com/eci-use-specs: ecs.gn5i-c4g1.xlarge
    spec:
      containers:
      - name: nginx
        image: registry-vpc.cn-beijing.aliyuncs.com/eci_open/nginx:1.15.10
        resources:
            limits:
              nvidia.com/gpu: '1'
        ports:
        - containerPort: 80
阿里云首页 容器服务 Kubernetes 版 ACK 相关技术圈