NVIDIA NIM模型使用指引

更新时间:2025-01-22 07:10:48

NVIDIA NIM是英伟达推出的一套易于使用的预构建容器工具,目的是帮助企业客户在云、数据中心和工作站上安全、可靠的部署高性能的Al模型推理。NIM模型大部分是英伟达做过优化的模型,相比原始开源模型有显著的部署性能优化,用户可以享受更好的模型推理性能。

模型列表

当前在人工智能平台PAI-Model Gallery中可直接部署的NVIDIA NIM模型如下:

模型名称

Model Gallery模型页面

NIM推理优化支持的机型

本地部署相关参考

模型名称

Model Gallery模型页面

NIM推理优化支持的机型

本地部署相关参考

MolMIM

MolMIM

通用GPU机型

  • 镜像地址:pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/molmim:1.0.0

  • 模型地址:oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/molmim/

  • 模型挂载路径:/home/nvs/.cache/nim/models/

Earth-2 FourCastNet

FourCastNet

通用GPU机型

  • 镜像地址:pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/fourcastnet:1.0.0

  • 模型地址:oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/fourcastnet/

  • 模型挂载路径:/opt/nim/.cache/

NVIDIA Retrieval QA Mistral 7B Embedding v2

NV-EmbedQA-Mistral-7b-v2

ecs.gn7e系列

  • 镜像地址:pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/nv-embedqa-mistral-7b-v2:1.0.1

  • 模型地址:oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/nv-embedqa-mistral-7b-v2/

  • 模型挂载路径:/opt/nim/.cache/

Eye Contact

eyecontact

通用GPU机型

  • 镜像地址:pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/maxine-eye-contact:1.0.0

  • 模型地址:oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/maxine-eye-contact/

  • 模型挂载路径:/opt/nim/.cache/

NV-CLIP

nvclip

  • ecs.gn7e系列

  • ecs.gn7i系列

  • 镜像地址:pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/nvclip:1.0.0

  • 模型地址:oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/nvclip/

  • 模型挂载路径:/opt/nim/.cache/

AlphaFold2-Multimer

AlphaFold2-Multimer

通用GPU机型

  • 镜像地址:pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/alphafold2-multimer:2.0.0

  • 模型地址:oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/alphafold2-multimer/

  • 模型挂载路径:/opt/nim/.cache/

Snowflake Arctic Embed Large Embedding

Arctic-embed-l

  • ecs.gn7e系列

  • ecs.gn7i系列

  • 镜像地址:pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/arctic-embed-l:1.0.1

  • 模型地址:oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/arctic-embed-l/

  • 模型挂载路径:/opt/nim/.cache/

NVIDIA Retrieval QA Mistral 4B Reranking v3

NV-RerankQA-Mistral-4B-v3

  • ecs.gn7e系列

  • ecs.gn7i系列

  • 镜像地址:pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/nv-rerankqa-mistral-4b-v3:1.0.2

  • 模型地址:oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/nv-rerankqa-mistral-4b-v3/

  • 模型挂载路径:/opt/nim/.cache/

NVIDIA Retrieval QA E5 Embedding v5

NV-EmbedQA-E5-v5

  • ecs.gn7e系列

  • ecs.gn7i系列

  • 镜像地址:pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/nv-embedqa-e5-v5:1.1.0

  • 模型地址:oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/nv-embedqa-e5-v5/

  • 模型挂载路径:/opt/nim/.cache/

Parakeet CTC Riva 1.1b

Parakeet-CTC-1.1b-asr

通用GPU机型

  • 镜像地址:pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/parakeet-ctc-1.1b-asr:1.0.0

  • 模型地址:oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/parakeet-ctc-1.1b-asr/

  • 模型挂载路径:/home/nvs/.cache/nim/

FastPitch HifiGAN Riva

FastPitchHifi-GAN

通用GPU机型

  • 镜像地址:pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/fastpitch-hifigan-tts:1.0.0

  • 模型地址:oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/fastpitch-hifigan-tts/

  • 模型挂载路径:/home/nvs/.cache/nim/

VISTA-3D

Vista-3D

通用GPU机型

  • 镜像地址:pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/vista3d:1.0.0

  • 模型地址:oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/vista3d/

  • 模型挂载路径:/opt/nim/.cache/

AlphaFold2

AlphaFold2

通用GPU机型

  • 镜像地址:pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/alphafold2:latest

  • 模型地址:oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/alphafold2/

  • 模型挂载路径:/opt/nim/.cache/

ProteinMPNN

ProteinMPNN

通用GPU机型

  • 镜像地址:pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/proteinmpnn:1.0.0

  • 模型地址:oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/proteinmpnn/

  • 模型挂载路径:/home/nvs/.cache/nim/

megatron-1b-nmt

megatron-1b-nmt

通用GPU机型

  • 镜像地址:pai-model-gallery-registry.cn-hangzhou.cr.aliyuncs.com/nim/megatron-1b-nmt:1.0.0

  • 模型地址:oss://pai-quickstart-cn-hangzhou/NVIDIA/NIM/megatron-1b-nmt/

  • 模型挂载路径:/home/nvs/.cache/nim/

PAI-Model Gallery中部署使用

  1. 进入PAI Model Gallery

  2. 在搜索框中搜索NVIDIA,或在左侧筛选栏筛选NVIDIA模型。

    image.png

  3. 选择NVIDIA模型进入模型详情页,单击右上角部署

    image.png

  4. 配置资源等信息后,即可完成NVIDIA NIM模型部署。

    image.png

本地部署使用

  1. 配置环境。详情请参见Getting Started

  2. 模型列表中获取对应镜像地址。本文以registry.cn-hangzhou.aliyuncs.com/eas/nim/molmim:1.0.0举例说明。

  3. 通过以下命令拉取镜像。

    docker pull registry.cn-hangzhou.aliyuncs.com/eas/nim/molmim:1.0.0
  4. 使用阿里云ossutil工具下载模型文件,模型文件地址见模型列表

  5. 使用命令启动容器。此处以模型文件保存在您本地/local/model/目录举例说明。

    docker run --rm \
    --runtime=nvidia \
    --gpus all \
    -u $(id -u) \
    -v /local/model/:${模型列表中的挂载路径} \
    registry.cn-hangzhou.aliyuncs.com/eas/nim/molmim:1.0.0

附录:首次使用PAI平台开通流程

对于未注册/未登录阿里云的用户,首次使用PAI-Model Gallery可参考以下流程:

  1. 访问阿里云,单击右上角登录,输入账号和密码进行登录(或注册新用户)。

    image.png

  2. 登录成功并且实名认证后,访问人工智能平台PAI

    如果您是首次使用PAI平台,需要先完成实名认证以及授权,所有选项保持默认,确认后等待十几秒钟即可完成创建,即可前往默认工作空间进行部署使用。

    image.png

  • 本页导读 (1)
  • 模型列表
  • 在PAI-Model Gallery中部署使用
  • 本地部署使用
  • 附录:首次使用PAI平台开通流程