Alibaba Cloud Linux 3 预装NVIDIA GPU驱动镜像

更新时间:
复制为 MD 格式

Alibaba Cloud Linux 3 预装NVIDIA GPU驱动和 CUDA专为AI开发与深度学习场景优化的高性能基础镜像,预置了主流版本的NVIDIA GPU驱动、CUDA、Docker引擎及NVIDIA Container Toolkit 等,开箱即用。您可快速部署GPU容器化环境,无缝运行大模型训练、推理任务,显著简化底层依赖配置,提升AI应用开发与部署效率。

预配置软件信息

该公共镜像预置驱动及软件信息如下:

内核版本、驱动及软件信息

Alibaba Cloud Linux 3 预装NVIDIA GPU驱动镜像

操作系统内核版本

5.10.134-19.2.al8.x86_64

Nvidia GPU 驱动版本

570.195.03

CUDA版本

12.8

cuDNN版本

9.8.0.87

NCCL

v2.27.7-1

OpenMPI

4.1.3

Docker

26.1.3

NVIDIA Container Toolkit

1.17.8

OFEDeRDMA

支持

性能调优软件keentune

默认未开启。

支持

Python 3

3.6.8

Alibaba Cloud Linux 3 预装NVIDIA GPU驱动镜像

支持的规格族

  • gn7e、gn7s、gn7i、gn6v、gn6i、gn6e、gn5、gn5i

  • ebmgn7e、ebmgn7i、ebmgn6v、ebmgn6i、ebmgn6e

  • ebmgn7ix、ebmgn7ex

  • gn8is、ebmgn8is、gn8v、ebmgn8v

系统环境变量配置

  • /etc/profile.d/nccl.sh

    export NCCL_HOME=/usr/local/nccl
    export LD_LIBRARY_PATH=${NCCL_HOME}/lib:$LD_LIBRARY_PATH
  • /etc/profile.d/openmpi.sh

    export MPI_HOME=/usr/local/openmpi
    export LD_LIBRARY_PATH=${MPI_HOME}/lib:$LD_LIBRARY_PATH
    export PATH=${MPI_HOME}/bin:$PATH
  • /etc/profile.d/cuda.sh

    export PATH=/usr/local/cuda/bin:$PATH
    export CUDA_HOME=/usr/local/cuda
    export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

常见问题

如何为Alibaba Cloud Linux 3 预装NVIDIA GPU驱动镜像开启keentune调优工具?

可通过如下步骤开启,并在操作系统重启后生效。

systemctl stop tuned
systemctl disable tuned
systemctl start keentune-target
systemctl enable keentune-target
systemctl enable keentuned
systemctl start keentuned
keentune profile set ai_common.profile

若想关闭keentune,执行keentune profile rollback即可,重启操作系统后生效。

ACK集群中使用Alibaba Cloud Linux 3 预装NVIDIA GPU驱动镜像需要注意什么?

请参考容器服务Kubernetes版文档中如何基于创建好的ECS实例创建自定义镜像,并使用该镜像创建节点使用须知及高危风险操作说明