申请 GPU 资源,将容器调度到满足可用 GPU 资源个数的机器上并将 GPU 资源分配给容器。

标签格式:

aliyun.gpu: "1"

aliyun.gpu 指定申请的 GPU 资源的个数。容器服务调度器会寻找满足可用 GPU 资源个数的机器,将容器部署到该机器上,将 GPU 资源分配给容器并将主机上的 GPU 卡映射到容器内。容器所分配到的 GPU 资源对于您是透明的。具体来说:

例如,如果您申请了一个 GPU 资源,主机上只有一个 /dev/nvidia1可用,容器服务会将主机上的 /dev/nvidia1映射为容器里的 /dev/nvidia0。这样会让您的程序和具体的设备号解耦。

示例:

serving:
    image: inception-serving:gpu
    labels:
       aliyun.gpu: "1"