模型训练

更新时间: 2024-03-16 12:30:45

概述

大模型服务平台提供的模型定制服务,为开发者提供常用LLM训练及其模型部署的全链路定制能力。

定制模型的场景有如下优势:

  1. 使用定制模型进行部署后,用户无需额外提供示例加入提示词中,可使用更少的token请求完成任务。

  2. 由于LLM已经在公开数据集上使用大量知识进行训练,对于新知识的学习仅需要少量数据集即可,通过少样本的学习,用户在较少的数据量准备以及较短的训练时间就可以完成大模型的训练。

  3. 在需要加入更多知识的场景下,受限于API提示词的长度,加入的提示词不一定可以取得较好效果, 通过fine-tuning,可以获得更好的效果

定制模型的主要流程,相对来说很简单,用户仅需要:

  1. 根据示例进行数据准备以及预处理工作;

  2. 发起定制服务请求,根据文档传入训练所必需的参数进行大模型训练;

  3. 训练结束后,根据效果是否满意进行服务部署并调用。

大模型服务平台提供的定制能力包括标准SFT训练(Supervised Fine-Tuning)和高效训练(LoRA等)的能力。