模型调优训练与模型评测-阿里云帮助中心

本篇文章讲解如何训练新模型。

视频介绍

定义

模型调优是通过Fine-tuning训练模式提高模型效果的功能模块，作为重要的大模型效果优化方式，用户可以通过构建符合业务场景任务的训练集，调整参数训练模型，训练模型学习业务数据和业务逻辑，最终提高在业务场景中的模型效果。

优势

•推理加速：平台底层默认进行模型压缩和推理加速，屏蔽机器管理和推理加速的技术工作。

•全链路训练平台：丰富、完整的模型训练工具，支持SFT、LoRa等多种优化方式，训练之后支持一键部署。

•多维度评估：支持单模型、多模型对比等多维度评估方式。

训练前的数据准备

训练集：训练所用的数据集，格式一般为Prompt+Completion的文本数据，可通过excel/json进行编辑和上传，最小训练数据条数为40，最大训练数据条数为10000，一条训练数据Prompt+Completion总字符数不高于8000，高于8000的字符数系统将自动截断。通过模型训练可增强模型能力，提升预测效果。

评测集：评测所用的数据集，格式一般为Prompt+Completion的文本数据，评测系统将自动基于Prompt数据预测模型结果，可通过参考评测集中的Completion数据对模型预测结果进行标识，判断模型效果，最小评测数据条数为1，最大条数为5000，Prompt总字符数不高于8000，以实际需要为准。通过模型评测评估模型效果，发现模型问题。

说明

Prompt：即提示词，简单的理解为它是给大模型的指令。它可以是一个问题、一段文字描述，甚至可以是带有一堆参数的文字描述。大模型会基于 prompt 所提供的信息，生成对应的文本或者图片。

Completion：是指根据Prompt输出的对应的答案/内容。

Prompt+Completion类于FAQ的格式。及一问一答的数据内容。