文档

模型调优

更新时间:
一键部署

模型调优

模型调优是通过Fine-tuning训练模式提高模型效果的功能模块,作为重要的大模型效果优化方式,用户可以通过构建符合业务场景任务的训练集,调整参数训练模型,训练模型学习业务数据和业务逻辑,最终提高在业务场景中的模型效果。

模型管理操作指南

下方提供整体模型调优的概念、使用说明与相关最佳实践案例的指引。

一般来讲,模型调优有四个主要过程,包括:

  • 数据准备:构建适合训练的训练数据集,一般来是问答Pair的组合,基于不同任务有不同的呈现形态。

  • 模型调优:通过选择合适的数据集,调整参数,训练特定的模型以提高模型效果,可通过训练过程/结果指标初步判断训练效果。

  • 模型部署:训练好的模型需要部署后方可提供推理服务(评测、应用调用均需先部署模型)。

  • 模型数据:构建合适的评测数据集,针对已经训练好的模型进行评测,通过评测系统进行打分或标注,验证模型调优的效果。

新增训练模型

点击【模型调优】模块,选择【训练新模型】按照提示进行创建。新增过程的专业名词可查看概念解释学习。

image

选择模型版本

目前支持预置模型自定义模型,首次新增模型训练时无可选自定义模型。

如何选择模型tips:

微调训练模型可以支持企业自定义训练数据,完成模型的微调训练,微调训练将影响模型的效果,选择合适的数据将使得模型效果更加适配企业的业务需求。企业可以选择基于企业专属大模型的基线版本进行微调,也可以选择基于已微调的模型版本上进行进一步微调。

image

选择训练数据

点击【选择数据集】按照操作引导,跳转到【训练数据】页面上传数据内容,数据内容至少40条内容。支持xls、xlsl格式。需下载模板后进行上传。

image

注意:选择合适的训练数据进行微调训练,训练数据需要按照既定的格式, 包含 Prompt / Completion对, 详细格式请见格式参考:example.excel训练数据支持本地上传或选择训练集管理中的数据,此处上传的训练集将同时保存在训练集管理中。

混合训练

通用混合训练支持用户将自身训练数据与采样的千问基础模型通用多领域、多行业、多场景数据混合,进行训练,从而提高训练效果,避免基础模型能力的遗失,注意,选择混合训练后,混合采样的数据将计入训练Token数据量中,一并计费,平台支持选择多个基础训练数据进行混合训练。

示例:中文-对话 1.1倍 >> 自主训练数据:基础模型中文对话数据以1:1.1的比例混合训练

示例:中文-数学 0.5倍 >> 自主训练数据:基础模型中文数学数据以1:0.5的比例混合训练

image

超参配置

企业可以通过参数配置来影响模型调优的过程,从而影响模型调优的效果,不同的参数配置训练的结果不同,一般建议使用默认配置。

image

自定义参数名词解释参考概念解释

开始训练

预览你的训练配置,准备开始训练,开始训练将进入队列,可在模型管理列表刷新状态,同时,可查看训练过程中的相关指标,训练结束后将通过推送通知。

重要

模型调优将产生训练费用,训练价格 0.1元/千tokens ,点击查看产品计费

计算公式:

计费token数= 训练集token数 * 循环次数。

模型调优开始后,就会产生费用(训练失败除外)。

image

image

模型列表

当正在训练中时,可以操作查看、终止训练。若训练完成后,可操作删除训练任务。

image

image

查看:可以查看正在训练中的模型信息;也可以在页面中点击【开始部署】 Traning loss、Validation Loss、Validation Token Accuracy 的名词解释请滑到下方段落查看。可以点击终止训练和刷新训练进展。

image

终止训练:将停止训练任务。状态为终止训练。

image

image

删除:点击删除后该模型将不会存在;谨慎操作。

image

模型部署:点击模型部署后,点击开始部署,模型部署内容请访问模型部署进行查看。

重要

注意:部署模型将产生模型部署费用,部署价格产品计费。模型开始部署后,就会产生费用(部署失败除外)。

  • 本页导读 (1)
文档反馈