如何模型训练

本篇文章讲解如何训练新模型。

视频介绍

定义

模型调优是通过Fine-tuning训练模式提高模型效果的功能模块,作为重要的大模型效果优化方式,用户可以通过构建符合业务场景任务的训练集,调整参数训练模型,训练模型学习业务数据和业务逻辑,最终提高在业务场景中的模型效果。

优势

推理加速:平台底层默认进行模型压缩和推理加速,屏蔽机器管理和推理加速的技术工作。

全链路训练平台:丰富、完整的模型训练工具,支持SFT、LoRa等多种优化方式,训练之后支持一键部署。

多维度评估:支持单模型、多模型对比等多维度评估方式。

训练前的数据准备

训练集:训练所用的数据集,格式一般为Prompt+Completion的文本数据,可通过excel/json进行编辑和上传,最小训练数据条数为40,最大训练数据条数为10000,一条训练数据Prompt+Completion总字符数不高于8000,高于8000的字符数系统将自动截断。通过模型训练可增强模型能力,提升预测效果。

评测集:评测所用的数据集,格式一般为Prompt+Completion的文本数据,评测系统将自动基于Prompt数据预测模型结果,可通过参考评测集中的Completion数据对模型预测结果进行标识,判断模型效果,最小评测数据条数为1,最大条数为5000,Prompt总字符数不高于8000,以实际需要为准。通过模型评测评估模型效果,发现模型问题。

说明

Prompt:即提示词,简单的理解为它是给大模型的指令。它可以是一个问题、一段文字描述,甚至可以是带有一堆参数的文字描述。大模型会基于 prompt 所提供的信息,生成对应的文本或者图片。

Completion:是指根据Prompt输出的对应的答案/内容。

Prompt+Completion类于FAQ的格式。及一问一答的数据内容。

模型微调训练方式

数据准备

准备多少数据做SFT微调训练合适?

SFT微调训练效果受大模型参数及训练数据集数量影响,数据量达到一定阈值后,效果不会再有明显上升。

SFT不同训练任务的数据实验参考

文本分类任务-情感分析:

训练数据量

100

200

500

1000

准确率

0.9559

0.9719

0.9719

0.978

文本生成-阅读理解

训练数据量

100

200

500

1000

2000

准确率

0.5808

0.5992

0.6202

0.611

0.6235

序列标注-命名实体识别

训练数据量

200

500

1000

2000

3000

4000

准确率

0.4749

0.5251

0.5731

0.6164

0.6613

0.6593

句对关系任务-文本匹配

训练数据量

100

200

500

1000

准确率

-

0.7515

0.7758

0.7828

上传数据集

点击训练数据上传训练集上传文件点击完成

说明
  • 支持批量上传,最多同时上传10个训练集。

  • 支持拓展名为xls、xlsx、jsonl。(已提供上传模板文件)

  • 单个文件最大20M。支持文生图、文本训练。

image

模型调优

点击【模型调优】模块,选择【训练新模型】按照提示进行创建。新增过程的专业名词可查看概念解释学习。

image

超参配置

企业可以通过参数配置来影响模型调优的过程,从而影响模型调优的效果,不同的参数配置训练的结果不同,一般建议使用默认配置。

image

开始训练

预览你的训练配置,准备开始训练,开始训练将进入队列,可在模型管理列表刷新状态,同时,可查看训练过程中的相关指标,训练结束后将通过推送通知。

重要

模型调优将产生训练费用,训练价格 0.03元/千tokens ,点击查看产品计费

计算公式:训练费用=训练集Token数量* 循环次数 *训练单价。

模型调优开始后,就会产生费用(训练失败除外)。

image

说明
  • 点击查看预估,可以查看本次训练的预估费用。

  • 在训练中的模型可以点击查看了解进度,也可以点击终止训练停止。

模型评测

上传模型数据

路径:模型工具模型评测创建评测任务

image

选择评测方式,页面上方有不同评测方式介绍,按需选择,建议选择单个评测。

image

imageimage

评测任务开始后,点击评测,可以自行对数据进行打标。

image

image

评测完成后可以点击下载查看评测结果。

image

如需模型部署,请点击参考模型部署