文档

模型训练最佳实践

更新时间:
一键部署

最佳实践

为了更好的讲解模型训练模块的使用,我们将通过一个训练示例完成整个训练流程使用说明,更多的示例请参考模型训练最佳实践。

示例任务:阅读理解

任务说明:依据给定的文本内容,模型完成内容的理解并且回答与内容相关的问题。

数据准备

这是一个根据给定文本回答问题的任务。 我们建议至少准备500条训练数据,训练数据集可准备成如下格式:

Prompt

Completion

阅读文章,回答问题:

南极探险家罗伯特·法尔肯·斯科特和弗兰克·比克顿都住在这座城市。艺术家包括描绘普利茅斯文化的贝丽尔·库克(Beryl Cook)和研究流浪、性行为和自杀主题的罗伯特·伦基维茨(Robert Lenkiewicz),他们从20世纪60年代一直生活在普利茅斯,直到2002年去世。儿童连续剧的插画家和创作者本恩先生和罗罗国王,大卫麦基,出生并在南德文郡长大,在普利茅斯艺术学院受训。爵士乐音乐家约翰·苏尔曼(John Surman)出生于附近的塔维斯托克(Tavistock),与该地区有着密切的联系,他的2012年专辑《Saltash Bells》就是明证。这位前卫的吉他手基思·罗出生在伦敦,1965年在伦敦成立了无爵士即兴演奏乐队AMM,1997年成立了MIMEO。这位音乐家兼电影导演科斯莫·贾维斯(Cosmo Jarvis)曾居住在南德文郡的几个城镇,并在普利茅斯及其周边地区拍摄过视频。此外,演员唐纳德·辛登爵士和朱迪·特洛特。特纳奖得主吉尔伯特和乔治的乔治·帕斯莫尔出生在这座城市,工党政治家迈克尔·富特(Michael Foot)也出生在这座城市,他的家人住在附近的特雷马顿城堡(Trematon Castle)。

问题:约翰·苏尔曼演奏什么类型的音乐?

爵士乐

任何滋补品都不要过量食用,枸杞子也不例外。一般来说,健康的成年人每天吃20克左右的枸杞子比较合适;如果想起到治疗的效果,每天最好吃30克左右。现在,很多关于枸杞子毒性的动物实验证明,枸杞子是非常安全的食物,里面不含任何毒素,可以长期食用。

阅读文本回答问题:

健康成人每天的枸杞子摄入多少比较合适?

健康的成年人每天吃20克左右的枸杞子比较合适;如果想起到治疗的效果,每天最好吃30克左右。

准备好数据之后,可通过平台的训练集管理将数据进行上传,上传后可前往训练模块进行引用。

功能路径:模型工具-训练数据-上传数据集,完成上传后,数据将显示在列表中,上传过程中系统将校验数据格式和数据量。image

训练准备

完成训练集的构建后,可进入模型管理界面选择训练集进行训练,平台提供Fine-tuning的训练方式,同时提供多种参数的调整,可依据业务需求和理解调整参数,优化模型训练效果。

我们以阅读理解后进行问答的任务为示例,演示模型训练的完整流程:

功能路径:模型工具-模型调优-训练新模型。

image

创建新模型训练任务需要选择模型类型,平台支持两种模型类型,如果第一次训练模型,一般选择预置模型,如果希望基于已训练的模型进行再次训练,则可选择自定义模型,定义如下:

预置模型

预置模型为未经过任何训练的原始模型,您可以通过选择预置模型进行训练从而得到自创模型,不同的基础模型的参数和能力不同,我们将持续推出不同能力方向的模型。

自定义模型

自定义模型是基于您训练过的模型进行再次训练,从而调优模型效果,请注意,由于大模型的训练原理,多次训练模型时,后序训练易丢失前序训练已习得的能力,建议后序训练数据需要采样或保持前序训练数据。

我们基于预置模型,训练阅读理解的任务。

image

选择模型后,需要选择训练数据集,此时我们选择在上方流程中已构建的百科知识阅读理解数据集。

image

完成数据集选择后,可进行模型的超参配置,模型的超参配置决定一定程度的模型训练效果,需要依据您自身的训练经验进行配置,平台同时提供基于实验所得的默认配置可供选择。

image.png

模型超参的解释如下:

关于参数调整的最佳实践,后续有对应实验后,我们将更新在文档中。

循环次数

循环次数代表模型训练过程中模型学习数据集的次数,可理解为看几遍数据,一般建议的范围是1-3遍即可,可依据需求进行调整

批次大小

批次大小代表模型训练过程中,模型更新模型参数的数据步长,可理解为模型每看多少数据即更新一次模型参数,一般建议的批次大小为16/32,表示模型每看16或32条数据即更新一次参数

Learning Rate Multiplier

Learning Rate Multiplier-学习率代表每次更新数据的增量参数权重,学习率数值越大参数变化越大,对模型影响越大,一般范围为:2-5e至2-8e

Prompt损失权重

Prompt损失权重的配置将影响模型学习样本及预测目标的遮盖范围,损失权重的设置范围是0.1-1.0,参数配置1.0表示完整学习样本(Prompt和Completion均不遮挡),参数设置为0.5表示从Completion侧开始向Prompt进行遮挡50%样本长度,参数越小,模型学习越少,收敛越快,但泛化性会变差,训练容易过拟合,参数越大,模型学习越完整,同时收敛越慢,训练成本越高

完成模型超参配置后,可点击下一步,进入训练预览阶段,点击开始训练后,平台将启动训练

注意,训练按照数据Token量收费,平台将自动计算训练所需Token量及预估费用,在训练开始提供给您进行确认,详情请见后续收费计价策略的规则详情。

image.png

模型训练

启动训练后,列表上的模型状态将变更为训练中,可通过点击查看按钮进入详情页,查看训练的详情,包括训练过程的指标、训练时长、数据详情等,同时可随时终止训练,我们这里仍然以百科知识阅读理解任务的训练为示例,此任务500条数据预计训练时间为3-4小时,Loss曲线逐步下降

功能路径:模型中心-模型管理-模型列表-查看。

image.png

image.png

模型训练过程中,平台将自动打印Loss/ACC指标,Loss/ACC指标可展示训练拟合效果和验证拟合效果,相关指标的说明如下,观测不同的指标趋势可判断模型是否训练方向跑偏/模型训坏。

Training Loss

Trianing Loss 代表针对训练数据学习的拟合程度,曲线一般呈现下降趋势,Loss越小,表示训练数据拟合程度越高,过小的Loss易导致数据过拟合,需要根据实际训练过程进行判断

Validation Loss

Validation Loss代表针对验证集学习的拟合程度,曲线一般呈现先下降后上升趋势,Loss越小,表示验证数据拟合程度越高,优秀的模型效果往往出现Validation Loss的最小值节点,此时拟合程度最佳,训练效果最好

Validation Token Accuracy

Validation Token Acc代表针对验证集学习的准确程度,曲线一般呈现上升趋势,训练过拟合后会呈现下降趋势,优秀的模型效果往往出现在Validation Token Acc的最大值节点,此时预测准确率最高,训练效果最好

一般来讲,千条以下的数据训练所需的时长为2-3个小时,由于平台承载训练业务量较多,可出现队列排队情况,请耐心等待,当训练任务完成后,列表及详情页中模型的状态将变更为待部署,此时模型已基本具备部署条件。

模型部署

完成训练后,模型需要部署到相应的服务资源上从而提供调用服务,在部署时,需要选择合适的计算资源来承载模型的调用服务,模型部署将以计算资源的部署时长进行计费,计算资源越大费用越高,单个计算资源单价固定,详细请见后续的模型计量计费的策略规则。

功能路径:模型训练-模型管理-模型部署-部署新模型。

image.pngimage.png

一般来说,部署时长在几十分钟到几个小时不等,由于资源限制,部署可能会产生队列,部署完成后,状态将变为运行中,运行中的模型可被调用,用于模型评测及应用调用。

功能路径:模型应用中心-新增应用。

如下图所示,对于已部署的模型,可通过企业专属模型应用创建基于此模型的专属应用,以供业务使用/调用。

image.png

模型评测

完成模型部署后,如需测试模型的效果,可在模型评测中进行评测,模型评测需要首先构建评测的数据集,构建方法类似于训练集的构建,数据格式同样是问答Pair对,对于Prompt而言往往是需要验证的问题,对于Completion而言往往是评测参考的答案,最终通过对比模型结果与参考答案,同时综合考虑模型结果的正确性,对模型结果进行打分或排序,得到模型真实效果。

模型评测有两种模式,解释如下:

单个评测

单个评测主要用来评测单一模型的效果,选择评测集后,平台将自动基于评测集中的Prompt预测模型结果,并且同时展示评测集中预置的评测结果作为参考,针对模型预测结果进行打分后,可判断模型效果

对比评测

对比评测主要用来评测多个模型的效果,选择评测集后,平台将自动基于评测集中的Prompt预测每个模型的结果,并且同时展示评测集中预置的评测结果作为参考,对比评测支持针对每个参与评测的模型进行打分,同时支持模型排序,通过评测结果可判断不同模型之间的效果差异

注意,对于对比评测而言,进行对比的每个微调模型均需独立部署方可进行评测,针对基础模型的评测将计量token调用费用,详情请见产品价格详情

一般训练或部署了单个模型的情况下,我们会进行单个评测,如果我们训练或部署了多个模型,希望对比不同模型的效果,则可选择对比评测模式进行评测。

注意:模型评测会产生模型服务调用费用,每个被评测的模型均会进行计费,计费逻辑与模型推理服务一致,按照token量进行计费。

  • 本页导读 (1)
文档反馈