大模型技术服务内容说明

更新时间:

1. 服务概述

1.1 服务说明

大模型应用咨询服务:

根据客户的业务诉求,基于大模型的相关应用的规划设计、咨询及相关项目管理服务,包含AI应用调优、模型训练咨询指导、工程部署指导和算力类产品使用指导培训等咨询服务。

大模型工程技术服务:

提供大模型整体模型工程应用、效果优化、模型训练及微调、模型实施部署的整体技术服务,覆盖从场景设计、数据和素材整理准备、产品部署培训、算法算力平台使用、测试和应用推广全过程。

大模型算力优化服务:

算力迁移和优化服务适用,根据客户的模型训练推理业务需求,帮助客户将服务部署在阿里云(或将部署在其他平台的算法模型训练推理任务,迁移到阿里云),支持根据目标GPU类型基于PAI或者ACS官方镜像进行相关算法模型镜像适配,并给予客户优化和改进建议。

2. 服务范围

2.1 大模型应用咨询服务范围

服务范围包含

大模型技术咨询服务:根据客户的业务诉求,基于大模型的相关应用场景进行整体规划设计、咨询及相关项目过程管理服务。

提供算力类产品的部署使用及评测服务。

服务范围不包含

  • 客户系统的代码开发。

  • 第三方软件的安装、测试、故障诊断、优化等日常运维服务。

注:对于不在云上稳定性保障服务(架构优化)范围内的第三方软件问题,客户可登录阿里云社区获取免费咨询,或联系云市场商家寻求帮助。

2.2 大模型工程技术服务范围

服务范围包含

  • 根据客户的业务诉求,基于大模型的相关应用场景进行整体规划设计和咨询类服务。

  • 基于公共云的大模型技术实施服务,包含数据准备、模型效果优化(含提示词工程优化实施、SFT实施)、大模型工程实施(含RAG工程设计与实施、Agent设计与实施)、集成指导、培训等,帮助客户快速启动大模型应用和在业务中应用大模型的产品技术能力。

  • 基于阿里云模型能力及工程提供对应的AI应用和优化服务,包含对应的效果呈现。

  • 提供上述过程的项目管理服务。

服务范围不包含

  • 客户业务系统的代码开发。

  • 第三方软件的安装、测试、故障诊断、优化等日常运维服务。

注:对于不在云上稳定性保障服务(架构优化)范围内的第三方软件问题,客户可登录阿里云社区获取免费咨询,或联系云市场商家寻求帮助。

2.3 大模型算力优化服务范围

服务范围包含

  • 环境准备服务:针对客户实际需求,提供相应的模型镜像适配,以及算法依赖的环境编译服务(不包括闭源包的改造和适配)。为后续的模型训练和推理提供对应的运行环境。

  • 模型推理部署服务:基于开源基模或训练优化后的模型,基于PAI或者ACS的推理服务产品,提供推理服务,包括基于PAI/ACS的模型推理部署、模型量化、推理性能压测等基础服务。

  • 模型训练优化服务:基于开源基模,全流程的场景能力增强训练服务,包括数据集处理、SFT/RL训练、模型蒸馏、效果评测等服务,以满足客户具体业务场景对模型能力增强的需求。

  • 异常问题定位与分析服务:对使用过程中遇到的各类问题,如不符合预期的训练吞吐和推理性能问题等,提供必要的分析和优化服务,以提升整体算力利用率和模型运行效率。

服务范围不包含

  • 代码开发。

  • 不涉及算力卡的其他业务的服务。

  • 第三方闭源软件的安装、测试、故障诊断、优化等日常运维服务。

  • 第三方训练,推理框架的改造优化。备注:仅支持基于现有的训推框架之上的优化服务。

3. 前提条件

  • 客户应提前至少15个自然日申请该服务,以便于阿里云评估客户业务目标及时间计划可行,确认是否承接该服务申请。

  • 如客户的申请涉及大批量资源需求,建议客户提前一个月申请,具体视供应链评估情况协商。

  • 客户应在阿里云承接服务后,提供场地、设备、必要的非生产环境及远程访问通道、权限、明确的业务目标,协助阿里云开展服务。

  • 客户应审核阿里云制定的项目实施计划,以书面形式(包括但不限于电子邮件)确认阿里云提供的具体实施计划。客户如无正当技术理由,不得否定双方已确认的技术建议或方案,以确保及时实现本服务目的。

  • 按双方协商约定时间执行具体的业务场景设计方案和技术实施方案。

3.1 分工边界

3.1.1 客户与阿里云

  • 客户购买大模型技术服务,经过阿里云审核及交流后确认服务成立。

  • 针对该服务的业务目标,双方商定并确认具体业务目标及范围。

3.1.2 客户

  • 客户指定一名具备合适技能和经验的项目经理作为与阿里云沟通的主要联系人,代表客户直接负责项目实施的计划、协调、监督与控制以及升级问题与风险,同时全权代表客户在本项目的各个方面做出决策。

  • 根据项目情况,由客户项目经理协调各方资源,并和阿里云一同讨论并圈定确定业务目标(如完成哪些大模型业务场景设计和技术实施)。

  • 提供场地、设备、必要的非生产环境及远程访问通道、权限等,配合阿里云开展服务。

  • 配合阿里云调研系统现有问题、算法模型训练配置、算力利用情况等,参与具体的计划实施,如业务架构,技术架构等。

  • 审核阿里云制定的实施计划,并以书面或邮件方式确认阿里云提出的具体实施计划。客户无正当技术理由,不得否定阿里云提供的技术建议或方案。

  • 对阿里云提供大模型业务场景设计方案、技术实施方案、算力迁移/部署/优化方案等进行审核;如购买大模型应用咨询服务,则由客户进行大模型业务方案和技术方案的实施。如购买了大模型工程技术服务,则按照项目分工约定进行实施,阿里云不负责甲方现有业务应用系统的改造及优化。如购买了大模型算力优化服务,由客户执行具体的迁移、部署、优化方案。

  • 客户作为运维主体,负责相关运维工作。

  • 授权阿里云针对安全事件进行7x24小时监控和分析。

3.1.3 阿里云

  • 指派一名有经验的项目经理执行项目管理,并引入、管理乙方项目组人员,与甲方项目经理沟通。

  • 了解客户业务目标、范围,制定实施计划, 并获得客户的书面(包括但不限于电子邮件)确认。

  • 提供本工作说明书规定的各项服务目录,如业务场景设计范围,提供可行方案。

3.1.4 完工标准

  • 提交《大模型技术咨询服务验收报告》,内容包括:场景现状和需求分析、基础设施现状调研、大模型场景设计方案。

  • 提交《大模型工程技术服务验收报告》,内容包括:对客户业务场景现状和需求分析、基础设施现状调研、大模型场景设计方案。基于公共云的大模型技术实施服务,包含数据准备、工程效果优化、集成指导、培训等,帮助客户快速启动大模型应用和在业务中应用大模型的产品技术能力。

  • 提交《算力迁移和优化服务验收报告》,内容包括:阿里云资源适配分析、性能评测分析、训推优化等建议或方案;在实施中所发现的问题及建议或解决方案。

3.2 大模型应用咨询服务项

服务内容:阿里云针对客户的业务目标,包含以下服务:

服务项

服务说明

场景需求调研

1.对客户的需求进行调研,确认客户业务痛点和大模型需求。

2.同步对现有的素材、知识库和数据情况进行确认。

基础设施调研

1.对基础设施,包含计算资源、网络情况、技术和产品架构等进行确认

2.明确企业知识库、数据库、应用API等场景需求素材来源端技术情况调研。

业务场景方案设计

1.对场景的端到端解决方案进行设计。 2.交付端产品设计方案。

3.3 大模型工程技术服务项

服务内容:阿里云针对客户的业务目标,包含以下服务:

服务项

服务说明

场景需求调研

1.对客户的需求进行调研,确认客户业务痛点和大模型需求。

2.同步对现有的素材、知识库和数据情况进行确认。

基础设施调研

1.对基础设施,包含计算资源、网络情况、技术和产品架构等进行确认。

2.明确企业知识库、数据库、应用API等场景需求素材来源端技术情况调研。

业务场景方案设计

1.对场景的端到端解决方案进行设计。

2.交付端产品设计方案。

技术实现架构设计

基于场景需求完成技术架构方案设计,确认大模型的实施技术架构。

数据和知识库准备

整理大模型所需的数据(知识库)并形成清单,进行数据和素材准备工作。

大模型工程实施

1.按照技术架构方案,完成RAG工程实施。

2.按照技术架构方案,完成Agent工程实施。

效果优化工程

1.大模型工程部署相关工作支持和链路测试。

2.进行工程化调优工作,包含提示词优化、SFT等。

3.最终效果呈现与验证。

试运行支持

试运行情况跟踪和相关汇报工作。

3.4 大模型算力优化服务项

服务内容:阿里云针对客户的业务目标,包含以下服务:

服务项

服务说明

专家保障团队

提供专职算力迁移优化技术经理。

业务目标梳理

1.确认算力服务迁移或部署目标。

2.确认业务范围。

现有系统分析

阿里云评测现有算力服务效率。

改造实施

阿里云根据输出基于阿里云产品的训推部署或者改造方案。

评测优化

对迁移或部署到阿里云的训推进行测评&问题优化。

演练及验证

根据客户业务目标进行验证改造。

算力迁移和优化服务方案实施报告

方案实施期间发生的问题、实施情况等提供服务报告。

4. 服务SLA

4.1 大模型应用咨询服务SLA

提供云上大模型技术咨询服务技术经理。

提供《大模型技术咨询服务工作计划书》及《大模型技术咨询服务验收报告》。

4.2 大模型工程技术服务SLA

提供云上大模型技术实施服务技术经理。

提供《大模型工程技术服务工作计划书》及《大模型技术实施服务验收报告》。

4.3 大模型算力优化服务SLA

提供算力迁移优化技术经理。

提供《算力迁移和优化服务工作计划书》及《算力迁移和优化服务验收报告》。

5. 服务流程

5.1 大模型应用咨询服务流程

申请时间限制:客户须至少应于大模型应用咨询服务开始日之前提前15个自然日提出申请。

image

5.2 大模型工程技术服务流程

申请时间限制:客户须至少应于大模型工程技术服务开始日之前提前15个自然日提出申请。

image

5.3 大模型算力优化服务流程

申请时间限制:客户须至少应于大模型算力优化服务开始日之前提前15个自然日提出申请。

大模型

6. 验收标准

6.1 大模型应用咨询服务验收标准

阿里云提供以下交付物,视为服务验收合格:

  • 1.阿里云交付《大模型技术咨询服务工作计划书》及《大模型业务场景设计方案》,并获得客户书面确认(含电子邮件形式)。

  • 《大模型技术咨询服务工作计划书》及《大模型业务场景设计方案》,内容包括:

    • 服务开始之前,阿里云对对客户的需求进行调研,确认客户业务痛点和大模型需求。

    • 基于客户的业务特性和业务需求,阿里云就客户业务提供大模型业务场景设计建议。

6.2 大模型工程技术服务验收标准

阿里云提供以下交付物,视为服务验收合格:

  • 阿里云交付《大模型技术实施服务工作计划书》及《大模型业务场景设计方案》、《大模型技术架构方案》并获得客户书面确认(含电子邮件形式)。

  • 《大模型业务场景设计方案》和《大模型技术实施方案》。内容包括:

    • 服务开始之前,阿里云对对客户的需求进行调研,确认客户业务痛点和大模型需求。

    • 基于客户的业务特性和业务需求,阿里云就客户业务提供大模型业务场景设计建议。

    • 基于场景需求完成技术架构方案设计,确认大模型的实施技术架构。

    • 整理大模型所需的数据(知识库)并形成清单,进行数据和素材准备工作。

    • 结合技术架构方案,进行工程实施(Rag实施、Agent实施)和效果调优(提示词调优、按需SFT等)。

    • 工程服务部署及SFT后模型部署相关工作支持和链路集成测试。

6.3 大模型算力优化服务验收标准

阿里云提供以下交付物,视为服务验收合格:

  • 阿里云交付《算力迁移和优化服务工作计划书》及《算力迁移和优化服务验收报告》,并获得客户书面确认(含电子邮件形式)。

  • 《算力迁移和优化服务工作计划书》及《算力迁移和优化服务验收报告》内容包括:

    • 服务开始之前,阿里云对客户算力需求的分析和迁移部署优化建议。

    • 基于客户的业务特性和业务需求,阿里云就客户应用系统提供方案建议。

7. 完成标志

实施结束并完成客户验收工作。