DeepSeek模型从部署微调到RAG应用开发-人工智能平台 PAI-阿里云

人工智能平台 PAI 为开发者提供从数据标注、模型开发到训练部署的全链路AI研发服务。其 Model Gallery （MaaS组件）集成多领域当前最佳模型（覆盖LLM、AIGC、CV、NLP等），通过低代码/零代码界面支持模型训练、压缩、评测、部署全流程，显著提升开发效率。本文为您介绍如何通过Model Gallery实现DeepSeek模型的云上部署、蒸馏、训练以及应用搭建。

准备工作

【必需】开通 PAI 并创建工作空间（注意地域选择）

工作空间是 PAI 平台的核心概念，旨在为企业和团队提供统一的计算资源管理、人员权限管理、AI资产管理等能力。目前在首次开通PAI时会创建一个默认工作空间，如果您还没有任何工作空间，请手动创建一个工作空间。同时还会默认开通对象存储OSS等必要功能，因为在AI开发中，我们需要借助云存储服务来访问、管理与存储我们的代码、模型、数据集等数据文件。

单击查看操作步骤

前往PAI 控制台开通 PAI。每个地域需单独开通，请注意地域选择。
（可选）如果您还没有开通 OSS 服务，请前往 OSS 控制台页面进行开通，并创建与 PAI 工作空间相同地域的 OSS Bucket：
如果您还没有任何工作空间，前往PAI-工作空间列表，单击新建工作空间。
成功开通 PAI 并创建好工作空间后，即可进入PAI Model Gallery 产品页面。

【推荐】领取PAI免费试用资源

对于首次开通PAI的用户，可以领取大量的免费试用资源，请新用户前往阿里云免费试用页面领取相应资源。

【注意】地域与资源规格

在刚刚开通PAI工作空间，以及创建OSS Bucket时，我们可以发现大部分阿里云的产品是有地域属性的。不同地域之间可能存在不互通的情况，因此在使用产品时需要我们注意地域的选择。
不同地域所提供的计算资源的规格、库存都可能大不相同，因此如果在某一地域发现缺少计算资源的情况，我们可以尝试切换地域来查看其他地域的资源库存。
PAI 平台支持按量付费（后付费）和包年包月（预付费）两种计费模式。在使用后付费资源时，由于所有用户共用同一个资源池，可能会出现资源没有库存的现象，这时可以尝试切换地域来寻找空闲的计算资源。
PAI 平台提供多样化的计算资源规格，适配不同使用场景。部分资源规格使用了白名单限制，可以根据您的使用场景咨询您的销售顾问。此外，PAI平台也支持灵骏智算资源，灵骏智算资源使用了高速网络进行通信，在一些场景中进行多机多卡分布式训练、多机多卡分布式部署时，只有使用通过高速网络连接的灵骏智算资源才能进行；灵骏智算资源也使用了白名单限制，如需使用请联系您的销售顾问。

【可选】创建 VPC 专有网络（分布式训练/部署需要）

在部分使用场景，如进行多机多卡分布式训练、多机多卡分布式部署时，需要机器之间使用 VPC 专有网络进行通信。此外，在部分需要连接公网的使用场景（例如，在EAS部署的服务默认是无法访问公网的）也需要通过 VPC 专有网络的公网端口才能实现。

在创建 VPC 专有网络时，请同时创建交换机与安全组。

创建VPC专有网络和交换机，请参见创建和管理专有网络。
创建同地域的安全组，请参见创建安全组。

创建好之后，可在Model Gallery中的训练/部署时使用VPC专有网络。

模型部署

您可以参考一键部署DeepSeek-V3、DeepSeek-R1模型进行DeepSeek相关模型的部署和调用。

建议您使用DeepSeek-R1-Distill-Qwen-7B（蒸馏版模型，尺寸较小，适合快速上手实践，且所需计算资源成本低，还可以使用免费试用资源）体验部署流程。

模型微调与蒸馏

微调训练：用私域数据来微调训练模型，让模型在私域数据上的回答更加精确。

模型蒸馏：将大模型的知识迁移到小模型中（用教师大模型生成训练数据来训练学生模型）。保留大模型的推理能力和准确性，同时大幅降低计算和存储成本。本质上也是微调训练的一种形式。

说明

模型微调训练并不是万能的，想要取得好的微调效果并不是简单的事情。模型微调训练受到数据集数量、数据集质量、微调训练参数等多方面的影响，往往一次成功的微调训练需要经历大量的实验对比。此外，在很多实际需求的场景中，模型微调训练并不一定是最优的解决方案，很有可能更加简单的知识库检索（RAG）应用便能满足您的需求。因此，我们还是需要从具体需求出发，再来判断使用何种方式去对已有的模型服务进行优化。

请根据您的具体需求，选择微调训练或者蒸馏训练。

模型蒸馏训练，请参见蒸馏DeepSeek-R1等深度推理大模型。

仅微调模型，请参见一键微调DeepSeek-R1蒸馏模型。

搭建AI应用

使用LangStudio开发应用

在 PAI 平台，我们提供了大模型应用开发（LangStudio）产品模块，简化了用户开发企业级大模型应用的过程。目前最热门的 AI 应用类型，例如 RAG知识库检索、联网搜索等，都已在 LangStudio 内置了模板，只需要简单的配置便可以创建相应的 AI 应用。

DeepSeek + 知识库：基于LangStudio搭建DeepSeek+RAG在金融和医疗领域的问答应用流
DeepSeek + 联网搜索：基于LangStudio&阿里云信息查询服务搭建DeepSeek联网搜索应用流
DeepSeek + 知识库 + 联网搜索：基于LangStudio&DeepSeek的RAG及联网搜索聊天机器人解决方案

使用EAS构建RAG

您也可以选择使用EAS快速部署基于DeepSeek的大模型RAG对话系统，目前支持灵活设置向量检索库或使用联网搜索。

DeepSeek + 联网搜索：RAG集成联网搜索搭建AI智能问答最佳实践
DeepSeek + 知识库：自定义部署RAG服务

集成到钉钉聊天

您可以通过阿里云计算巢AppFlow（应用集成和自动化工具）轻松集成DeepSeek模型服务到钉钉聊天，请参见部署DeepSeek并集成到钉钉聊天。