在PPU上快速部署DeepSeek-R1/V3推理服务-真武 PPU 云服务(ppu)-阿里云帮助中心

DeepSeek系列模型（如R1/V3）是由深度求索公司推出的高性能推理模型，PAI Model Gallery现已支持在PPU资源上快速部署DeepSeek系列模型的推理服务。

操作步骤

本文以DeepSeek-R1为例演示操作流程，该流程同样适用于在PPU上部署其他模型。

登录PAI控制台，左上角选择支持PPU资源的地域，本文以乌兰察布为例为您介绍操作步骤。
说明
目前支持PPU资源的地域包括：乌兰察布、北京、上海、杭州。
在左侧菜单栏单击工作空间列表，选择进入目标工作空间。如果您有PPU的资源配额，可选择关联该配额的工作空间。
在左侧菜单栏单击Model Gallery，在模型列表中搜索并选择DeepSeek-R1模型卡片。
进入模型详情页面，然后单击右上角的部署。
在部署页配置如下关键参数，其他参数默认即可。
- 推理引擎：选择vLLM。
- 部署模板：选择单机-GP7V机型。
- 资源类型：可选择公共资源，或者如果已有PPU资源配额，可选择资源配额。
  - 公共资源：采用按量付费模式。资源规格请选择ml.gp7vf.16.40xlarge或ml.gp7va.16.48xlarge。
  - 资源配额：资源配额选择PPU配额，部署资源可配置如下：
  - 专有网络配置：如果选择使用公共资源，则必须配置专有网络VPC、交换机、安全组。
单击部署按钮，等待服务部署成功。
目前公共资源组的后付费PPU库存紧张，如使用公共资源组可能需要较长时间等待资源。您可以单击更多 > 更多信息查看部署状态信息。
调用模型服务。部署成功后即可调用模型推理服务，您可以直接参考模型详情页介绍的API调用模型，或查看文档通过网关进行公网或内网调用（默认）。