eGPU是阿里云自研的面向云原生场景的GPU容器虚拟化软件方案。可以在业务性能几乎无损失的情况下,对物理GPU进行细粒度的灵活切分与隔离,共享给多个业务实例同时使用。本文为您介绍如何安装eGPU。

通过安装包安装eGPU

说明

灵骏的计算节点默认已内置安装了eGPU优化套件,通常场景下您无需手动安装。

获得安装包之后,可直接通过安装命令进行安装和一般配置。

  • 安装命令(CentOS系统)

    rpm -ivh ./amp-vgpu-runtime-1.5.xxx-1.x86_64.rpm
    echo -e "D\nY\nN\nN" | sudo amp_config
  • 卸载命令(CentOS系统)

    rpm -e amp-vgpu-runtime

通过容器安装eGPU

获得eGPU容器镜像vgpuinstall:v1.5.xxx后,可运行该镜像并通过环境变量INSTALLINSTALL_OPTION控制安装或卸载。

  • 安装示例

    sudo docker run \
        --rm --privileged --net=host --ipc=host --pid=host \
        --volume /tmp/amp:/amp \
        -e INSTALL="true" \
        -e INSTALL_OPTION="D\\nY\\nN\\nN" \
        reg.docker.alibaba-inc.com/amppublish/vgpuinstall:v1.5
  • 卸载示例

    sudo docker run \
     --rm --privileged --net=host --ipc=host --pid=host \
     --volume /tmp/amp:/amp \
     -e INSTALL="false" \
     reg.docker.alibaba-inc.com/amppublish/vgpuinstall:v1.5