DeepSeek模型开发应用指南

人工智能平台 PAI 为开发者提供从数据标注、模型开发到训练部署的全链路AI研发服务。其 Model Gallery (MaaS组件)集成多领域当前最佳模型(覆盖LLM、AIGC、CV、NLP等),通过低代码/零代码界面支持模型训练、压缩、评测、部署全流程,显著提升开发效率。本文为您介绍如何通过Model Gallery实现DeepSeek模型的云上部署、蒸馏、训练以及应用搭建。

准备工作

【必需】开通 PAI 并创建工作空间(注意地域选择)

工作空间是 PAI 平台的核心概念,旨在为企业和团队提供统一的计算资源管理、人员权限管理、AI资产管理等能力。目前在首次开通PAI时会创建一个默认工作空间,如果您还没有任何工作空间,请手动创建一个工作空间。同时还会默认开通对象存储OSS等必要功能,因为在AI开发中,我们需要借助云存储服务来访问、管理与存储我们的代码、模型、数据集等数据文件。

单击查看操作步骤

  1. 前往PAI 控制台开通 PAI。每个地域需单独开通,请注意地域选择。

    image.png

  2. (可选)如果您还没有开通 OSS 服务,请前往 OSS 控制台页面进行开通,并创建与 PAI 工作空间相同地域的 OSS Bucket:

    image.png

  3. 如果您还没有任何工作空间,前往PAI-工作空间列表,单击新建工作空间

    image.png

  4. 成功开通 PAI 并创建好工作空间后,即可进入PAI Model Gallery 产品页面image.png

【推荐】领取PAI免费试用资源

对于首次开通PAI的用户,可以领取大量的免费试用资源,请新用户前往阿里云免费试用页面领取相应资源。

image.png

【注意】地域与资源规格

  1. 在刚刚开通PAI工作空间,以及创建OSS Bucket时,我们可以发现大部分阿里云的产品是有地域属性的。不同地域之间可能存在不互通的情况,因此在使用产品时需要我们注意地域的选择。

  2. 不同地域所提供的计算资源的规格、库存都可能大不相同,因此如果在某一地域发现缺少计算资源的情况,我们可以尝试切换地域来查看其他地域的资源库存。

    image.png

  3. PAI 平台支持按量付费(后付费)和包年包月(预付费)两种计费模式。在使用后付费资源时,由于所有用户共用同一个资源池,可能会出现资源没有库存的现象,这时可以尝试切换地域来寻找空闲的计算资源。

  4. PAI 平台提供多样化的计算资源规格,适配不同使用场景。部分资源规格使用了白名单限制,可以根据您的使用场景咨询您的销售顾问。此外,PAI平台也支持灵骏智算资源,灵骏智算资源使用了高速网络进行通信,在一些场景中进行多机多卡分布式训练、多机多卡分布式部署时,只有使用通过高速网络连接的灵骏智算资源才能进行;灵骏智算资源也使用了白名单限制,如需使用请联系您的销售顾问。

    image.png

【可选】创建 VPC 专有网络(分布式训练/部署需要)

在部分使用场景,如进行多机多卡分布式训练、多机多卡分布式部署时,需要机器之间使用 VPC 专有网络进行通信。此外,在部分需要连接公网的使用场景(例如,在EAS部署的服务默认是无法访问公网的)也需要通过 VPC 专有网络的公网端口才能实现。

在创建 VPC 专有网络时,请同时创建交换机与安全组。

  1. 创建VPC专有网络和交换机,请参见创建和管理专有网络

  2. 创建同地域的安全组,请参见创建安全组

创建好之后,可在Model Gallery中的训练/部署时使用VPC专有网络。 image.png

模型部署

您可以参考一键部署DeepSeek-V3、DeepSeek-R1模型进行DeepSeek相关模型的部署和调用。

建议您使用DeepSeek-R1-Distill-Qwen-7B(蒸馏版模型,尺寸较小,适合快速上手实践,且所需计算资源成本低,还可以使用免费试用资源)体验部署流程。

模型微调与蒸馏

微调训练:用私域数据来微调训练模型,让模型在私域数据上的回答更加精确。

模型蒸馏:将大模型的知识迁移到小模型中(用教师大模型生成训练数据来训练学生模型)。保留大模型的推理能力和准确性,同时大幅降低计算和存储成本。本质上也是微调训练的一种形式。

说明

模型微调训练并不是万能的,想要取得好的微调效果并不是简单的事情。模型微调训练受到数据集数量、数据集质量、微调训练参数等多方面的影响,往往一次成功的微调训练需要经历大量的实验对比。此外,在很多实际需求的场景中,模型微调训练并不一定是最优的解决方案,很有可能更加简单的知识库检索(RAG)应用便能满足您的需求。因此,我们还是需要从具体需求出发,再来判断使用何种方式去对已有的模型服务进行优化。

请根据您的具体需求,选择微调训练或者蒸馏训练。

模型蒸馏训练,请参见蒸馏DeepSeek-R1等深度推理大模型

仅微调模型,请参见一键微调DeepSeek-R1蒸馏模型

搭建AI应用

使用LangStudio开发应用

在 PAI 平台,我们提供了大模型应用开发(LangStudio)产品模块,简化了用户开发企业级大模型应用的过程。目前最热门的 AI 应用类型,例如 RAG知识库检索、联网搜索等,都已在 LangStudio 内置了模板,只需要简单的配置便可以创建相应的 AI 应用。

使用EAS构建RAG

您也可以选择使用EAS快速部署基于DeepSeek的大模型RAG对话系统,目前支持灵活设置向量检索库或使用联网搜索。

集成到钉钉聊天

您可以通过阿里云计算巢AppFlow(应用集成和自动化工具)轻松集成DeepSeek模型服务到钉钉聊天,请参见部署DeepSeek并集成到钉钉聊天