NVIDIA NIM模型使用指引_人工智能平台 PAI(PAI)-阿里云帮助中心

NVIDIA NIM是英伟达推出的一套易于使用的预构建容器工具，目的是帮助企业客户在云、数据中心和工作站上安全、可靠的部署高性能的Al模型推理。NIM模型大部分是英伟达做过优化的模型，相比原始开源模型有显著的部署性能优化，用户可以享受更好的模型推理性能。

模型列表

当前在人工智能平台PAI-Model Gallery中可直接部署的NVIDIA NIM模型如下：

模型名称	Model Gallery模型页面	NIM推理优化支持的机型	本地部署相关参考

模型名称	Model Gallery模型页面	NIM推理优化支持的机型	本地部署相关参考
MolMIM	MolMIM	通用GPU机型	镜像地址：pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/molmim:1.0.0 模型地址：oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/molmim/ 模型挂载路径：/home/nvs/.cache/nim/models/
Earth-2 FourCastNet	FourCastNet	通用GPU机型	镜像地址：pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/fourcastnet:1.0.0 模型地址：oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/fourcastnet/ 模型挂载路径：/opt/nim/.cache/
NVIDIA Retrieval QA Mistral 7B Embedding v2	NV-EmbedQA-Mistral-7b-v2	ecs.gn7e系列	镜像地址：pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/nv-embedqa-mistral-7b-v2:1.0.1 模型地址：oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/nv-embedqa-mistral-7b-v2/ 模型挂载路径：/opt/nim/.cache/
Eye Contact	eyecontact	通用GPU机型	镜像地址：pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/maxine-eye-contact:1.0.0 模型地址：oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/maxine-eye-contact/ 模型挂载路径：/opt/nim/.cache/
NV-CLIP	nvclip	ecs.gn7e系列 ecs.gn7i系列	镜像地址：pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/nvclip:1.0.0 模型地址：oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/nvclip/ 模型挂载路径：/opt/nim/.cache/
AlphaFold2-Multimer	AlphaFold2-Multimer	通用GPU机型	镜像地址：pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/alphafold2-multimer:2.0.0 模型地址：oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/alphafold2-multimer/ 模型挂载路径：/opt/nim/.cache/
Snowflake Arctic Embed Large Embedding	Arctic-embed-l	ecs.gn7e系列 ecs.gn7i系列	镜像地址：pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/arctic-embed-l:1.0.1 模型地址：oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/arctic-embed-l/ 模型挂载路径：/opt/nim/.cache/
NVIDIA Retrieval QA Mistral 4B Reranking v3	NV-RerankQA-Mistral-4B-v3	ecs.gn7e系列 ecs.gn7i系列	镜像地址：pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/nv-rerankqa-mistral-4b-v3:1.0.2 模型地址：oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/nv-rerankqa-mistral-4b-v3/ 模型挂载路径：/opt/nim/.cache/
NVIDIA Retrieval QA E5 Embedding v5	NV-EmbedQA-E5-v5	ecs.gn7e系列 ecs.gn7i系列	镜像地址：pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/nv-embedqa-e5-v5:1.1.0 模型地址：oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/nv-embedqa-e5-v5/ 模型挂载路径：/opt/nim/.cache/
Parakeet CTC Riva 1.1b	Parakeet-CTC-1.1b-asr	通用GPU机型	镜像地址：pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/parakeet-ctc-1.1b-asr:1.0.0 模型地址：oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/parakeet-ctc-1.1b-asr/ 模型挂载路径：/home/nvs/.cache/nim/
FastPitch HifiGAN Riva	FastPitchHifi-GAN	通用GPU机型	镜像地址：pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/fastpitch-hifigan-tts:1.0.0 模型地址：oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/fastpitch-hifigan-tts/ 模型挂载路径：/home/nvs/.cache/nim/
VISTA-3D	Vista-3D	通用GPU机型	镜像地址：pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/vista3d:1.0.0 模型地址：oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/vista3d/ 模型挂载路径：/opt/nim/.cache/
AlphaFold2	AlphaFold2	通用GPU机型	镜像地址：pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/alphafold2:latest 模型地址：oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/alphafold2/ 模型挂载路径：/opt/nim/.cache/
ProteinMPNN	ProteinMPNN	通用GPU机型	镜像地址：pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/proteinmpnn:1.0.0 模型地址：oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/proteinmpnn/ 模型挂载路径：/home/nvs/.cache/nim/
megatron-1b-nmt	megatron-1b-nmt	通用GPU机型	镜像地址：pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/megatron-1b-nmt:1.0.0 模型地址：oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/megatron-1b-nmt/ 模型挂载路径：/home/nvs/.cache/nim/

在PAI-Model Gallery中部署使用

进入PAI Model Gallery。
在搜索框中搜索NVIDIA，或在左侧筛选栏筛选NVIDIA模型。
选择NVIDIA模型进入模型详情页，单击右上角部署。
配置资源等信息后，即可完成NVIDIA NIM模型部署。

本地部署使用

配置环境。详情请参见Getting Started。
在模型列表中获取对应镜像地址。本文以registry.cn-hangzhou.aliyuncs.com/eas/nim/molmim:1.0.0举例说明。

通过以下命令拉取镜像。

docker pull registry.cn-hangzhou.aliyuncs.com/eas/nim/molmim:1.0.0

使用阿里云ossutil工具下载模型文件，模型文件地址见模型列表。

使用命令启动容器。此处以模型文件保存在您本地/local/model/目录举例说明。

docker run --rm \
--runtime=nvidia \
--gpus all \
-u $(id -u) \
-v /local/model/:${模型列表中的挂载路径} \
registry.cn-hangzhou.aliyuncs.com/eas/nim/molmim:1.0.0

附录：首次使用PAI平台开通流程

对于未注册/未登录阿里云的用户，首次使用PAI-Model Gallery可参考以下流程：

访问阿里云，单击右上角登录，输入账号和密码进行登录（或注册新用户）。
登录成功并且实名认证后，访问人工智能平台PAI。
如果您是首次使用PAI平台，需要先完成实名认证以及授权，所有选项保持默认，确认后等待十几秒钟即可完成创建，即可前往默认工作空间进行部署使用。