如何快速训练大模型

更新时间:

本次实验任务是在阿里云百炼平台上通过模型训练和部署的方式提升问答效果。模型训练是通过Fine-tuning微调训练定向提升大模型效果,作为重要的大模型效果优化方式。

场景简介

本次实验任务是在阿里云百炼平台上,通过模型微调训练方式提升大模型问答效果。模型训练是通过Fine-tuning微调训练提高模型效果的功能模块,作为重要的大模型效果优化方式。您可以通过构建符合业务场景任务的训练集,调整参数训练模型,训练模型学习业务数据和业务逻辑,最终提高在业务场景中的模型效果。

目前阿里云百炼提供的大模型训练方式请参考。

image

背景知识

本场景主要涉及以下云产品和服务:

  • 大模型服务平台百炼

    基于通义系列大模型和三方大模型的一站式大模型服务平台,提供生成式大模型的全流程应用工具和企业大模型的全链路训练工具。

您可扫描下方二维码或者钉钉搜索钉钉群号: 77600022533,加入阿里云百炼答疑群。

image

前提条件

云起实验室将在您的账号下开通本次实操资源,资源按量付费,需要您自行承担本次实操的云资源费用。

重要

本实验预计产生费用1元。如果您调整了资源规格、使用时长,或执行了本方案以外的操作,可能导致费用发生变化,请以控制台显示的实际价格和最终账单为准。

进入实操前,请确保阿里云账号满足以下条件:

  • 已通过实名认证并且账户余额充足。

  • 云资源产生的费用需您自行承担,云起实验室不会向您征收额外费用。

  • 所有实验操作将保留至您的账号,请谨慎操作。

  • 实操结束后,您可以选择继续付费保留资源,或参考手册自动/手动释放资源。

费用说明

在本实验中,使用阿里云百炼的模型训练会产生一定的费用,详情请参见产品计费

  • 模型训练将产生训练费用,训练价格 0.1元/千tokens。

  • 计算公式:

    • 计费token数= 训练集token数 * 循环次数。

    • 模型训练开始后,就会产生费用(训练失败除外)。

开通大模型服务平台百炼

本步骤指导您如何开通大模型服务平台百炼,如果您已开通过,请跳过此步骤。

说明

大模型服务平台百炼为首次开通服务的用户提供免费试用额度,开通的阿里云主账号与其RAM子账号共享免费试用额度。免费试用额度从开通阿里云百炼或模型申请通过之日起计算有效期,有效期一般是30~180天不等。

  1. 在实验页面,勾我已阅读并同意《阿里云云起实践平台服务协议》后,单击进入实操

    image

  2. 前往阿里云百炼控制台,如果页面顶部显示以下消息,您需要开通阿里云百炼的模型服务,以获得免费额度。如果未显示该消息,则表示您已经开通,请跳过此步骤。

    image

  3. 在弹出的对话框中,勾选我已阅读并同意《模型管理服务协议》,单击确认开通

    image

训练数据准备

模型训练是通过Fine-tuning训练模式提高模型效果的功能模块,作为重要的大模型效果优化方式,用户可以通过构建符合业务场景任务的训练集,调整参数训练模型,训练模型学习业务数据和业务逻辑,最终提高在业务场景中的模型效果

  • 训练集:训练所用的数据集,格式一般为Prompt+Completion的文本数据,可通过excel/json进行编辑和上传,最小训练数据条数为20,最大训练数据条数为10000,一条训练数据Prompt+Completion总字符数不高于8000,高于8000的字符数系统将自动截断。通过模型训练可增强模型能力,提升预测效果。

  • 评测集:评测所用的数据集,格式一般为Prompt+Completion的文本数据,评测系统将自动基于Prompt数据预测模型结果,可通过参考评测集中的Completion数据对模型预测结果进行标识,判断模型效果,最小评测数据条数为1,最大条数为5000,Prompt总字符数不高于8000,以实际需要为准。通过模型评测评估模型效果,发现模型问题。

  • SFT不同训练任务的数据实验参考。

  1. 单击此链接下载示例文档,并在本地解压,用于测试使用。

  2. 前往数据集页面, 单击新增数据集

    image

  3. 新增数据集页面,数据集名称设置为训练集数据集类型选择训练集立即发布选择,在上传文件中上传示例文件的训练集文件,单击确认

    说明

    支持批量上传,最多同时上传10个训练集,支持拓展名为xls、xlsx、jsonl,单个文件最大20M。

    image

  4. 数据集页签,您可以查看到上传的训练集,单击右上角的image图标刷新页面,查看最新导入状态。该条数据集发布状态更新为已发布后,才可以用于模型调优。

    image

模型训练

模型训练是通过Fine-tuning训练模式提高模型效果的功能模块,作为重要的大模型效果优化方式,用户可以通过构建符合业务场景任务的训练集,调整参数训练模型,训练模型学习业务数据和业务逻辑,最终提高在业务场景中的模型效果。

  1. 在左侧导航栏中,单击模型调优

    image

  2. 模型调优页面,单击训练新模型

    image

  3. 训练新模型页面,选择模型训练方式SFT微调训练选择模型预制模型 > 通义千问-Turbo训练方式选择全参训练选择训练数据选择刚刚新增的训练集,选择验证数据选择验证集 > 新增的训练集,未提及的参数保持默认即可,然后单击开始训练

    image

    image

  4. 模型调优计费提醒对话框中,单击开始训练

    重要

    训练费用(预估)=(训练数据tokens+混合训练数据tokens)✖️循环次数✖️训练单价,详情请参见产品计费

    image

  5. 模型调优页面,您可以看到模型正在训练中,请您耐心等待训练完成。您可以在查看预估中查看本次训练的预估费用,可以在操作列下的查看中了解训练进度,也可以终止训练

    说明

    本实验模型训练大约需要20分钟。

    image

  6. 模型调优页面,当训练状态变为训练成功时,表示新模型已训练成功。

    image

评测数据准备

  1. 在左侧导航栏中,单击数据管理

    image

  2. 数据集页签,单击新增数据集

    image

  3. 新增数据集页面,数据集名称设置为评测集数据集类型选择评测集立即发布选择,在上传文件中上传示例文件的评测集文件,然后单击确认

    说明

    支持批量上传,最多同时上传10个训练集,支持拓展名为xls、xlsx、jsonl,单个文件最大20M。

    image

  4. 模型数据页面,您可以查看到上传的评测集,单击右上角的image图标刷新页面,查看最新导入状态。该条评测集发布状态更新为已发布后,才可以用于模型调优。

    image

模型评测

通过模型评测,来检验训练出来的模型是否能够给出自己所期望的结果。现在您可以开始模型评测了,本实验以单个评测为例。

  1. 在左侧导航栏中,单击模型评测

    image

  2. 评测任务页签,单击创建评测任务

    image

  3. 创建评测任务页面,评测方式选择人工评测评测类型选择单个评测选择模型选择通义千问-Max选择评测数据选择选择新增的评测集,维度模板选择综合评价(内置),单击开始评测

    image

  4. 评测任务页签,您可以看到任务正在执行中,请您耐心等待评测状态变为标注中。单击右上角的image图标刷新页面,查看最新评测状态。

    image

  5. 评测任务页签,评测状态变为标注中后,单击标注

    image

  6. 在评测页面,您可以自行对数据进行打标。评测中您可以看到评测集结果和模型A的结果对比,若两个答案一致,您可以在综合评价中标记较好,若答案有出入,请您按照实际情况进行标记。

    image

  7. 全部标记完成后返回至评测任务页签,当任务的评测状态已完成时,单击其右侧操作列下的结果,查看评测结果。

    说明

    更多关于人工评测报告的参数说明,详情请参见查看模型评测结果

    image

    image

  8. 评测任务页签,单击其右侧操作列下的下载,可以将模型评测结果报告下载到本地(xlsx格式)。

    image

清理资源

  • 在完成实验后,如果无需继续使用资源,请根据以下步骤,先删除相关资源,再结束实操。

    • 删除阿里云百炼相关资源。

      1. 前往模型调优页面,找到目标模型,单击右侧操作列下的删除

        image

      2. 在左侧导航栏中,单击模型评测,找到目标评测任务,选择其右侧操作列下的更多 > 删除

        image

      3. 在左侧导航栏中,单击数据管理,分别单击评测集和训练集右侧操作列下的删除

        image

    • 删除相关资源后,选择不保留资源,单击结束实操。在结束实操对话框中,单击确定

      image

  • 在完成实验后,如果需要继续使用资源,选择付费保留资源,单击结束实操。在结束实操对话框中,单击确定。请随时关注账户扣费情况,避免发生欠费。

    image