全部产品
云市场

PAI自动学习简介

更新时间:2019-09-05 19:41:43

PAI AutoLearning自动学习是PAI平台推出的全新自动机器学习平台,以少量标注数据为输入,无需人工智能基础、无需写代码、无需调参,模型训练完整过程交给PAI AutoLearning,即可得到高可用的模型。

概述

PAI AutoLearning(简称PAI AL)自动学习支持在线标注、自动模型训练、超参优化以及模型评估。在平台上只需准备少量标注数据,设置训练时长即可得到深度优化的模型。同时自动学习PAI AL平台与EAS模型在线服务打通,一键完成模型部署。

  • 已支持区域:华北2、华东1
  • 已支持场景:图片分类

公测阶段

目前处于公测阶段,在此期间模型训练不收取费用。

模板示例

在产品首页提供了两个图片分类的模板实例:动物分类和商品分类(即将上架)。使用模板示例创建的实例无需OSS授权,可直接使用产品内置的源数据进行训练,一键体验PAI AL自动学习平台模型训练三部曲:数据标注、模型训练评估以及模型试用部署。

OSS授权

PAI AL的训练数据存放于阿里云OSS中,在创建PAI AL实例之前需要先完成OSS授权,OSS授权可参考OSS授权文档

两种图片标注方式

PAI AutoLearning平台接入OSS数据源,支持两种图片打标方式,一种是在线图片标注,另一种是导入已经打标的图片数据,两种方式的使用方式和限制分别介绍如下。

在线图片标注

如果数据量较小,比如训练图片小于50张时,可以使用在线图片标注的方式。PAI AL平台提供了在线打标的功能,可以在平台完成增加标签、删除标签、在线图片标注。

注意:

  • 要求所有图片数据放在同一个文件夹下,创建实例时指定该文件夹路径;
  • 支持图片格式:jpeg、jpg、png、bmp、tiff等

导入已标注文件

如果训练数据量较大,可以采用导入已标注文件的方式。要求所有图片和标注文件放在同一个OSS路径下,创建实例时,只需指定标注文件,系统自动读取所有图片。已标注文件的格式如下:

  1. id,oss data,label
  2. 0,"{""tfspath"":""oss://autodl/yuyi/t4.jpeg""}","{""option"":""虎""}"
  3. 1,"{""tfspath"":""oss://autodl/yuyi/pb5.jpeg""}","{""option"":""北极熊""}"
  4. 2,"{""tfspath"":""oss://autodl/yuyi/cat4.jpeg""}","{""option"":""猫""}"

注意:

  • 要求所有图片数据和标注文件放在同一个文件夹下,创建实例时指定标注文件;
  • 支持图片格式:jpeg、jpg、png、bmp、tiff等

训练设置

在完成图片打标后,直接进入模型训练设置页面。

PAI AutoLearning模型训练仅需设置最大训练时长,同时支持模型增量训练。公测期间限制训练时长最长为1小时。

最大训练时长:模型训练的最长时间。PAI AutoLearning预置了Early Stop机制,防止模型训练时间过长出现过拟合。

增量训练:在历史已有模型上进行增量训练。利用新的输入数据扩展现有模型。

模型效果评估

完成训练基础设置后,进入模型训练及评估页面。

当前页面展示了模型训练的完整进度,通过模型列表下拉的方式可查看每次训练生成模型的效果,包括准确率、精确率、召回率、F1-Score。同时提供了测试集的预测结果以及F1-Score评估指标。模型右侧提供了查看日志、模型试用、模型部署及删除按钮。

  • 查看日志:可直接查看模型训练的完整过程,以及运行成功、失败的错误日志。
  • 模型试用:在生成模型后,点击试用可上传本地文件调用模型进行预测。
  • 模型部署:训练得到的最佳模型可一键部署到PAI EAS。(如何部署PAI AutoLearning模型

模型试用

在生成模型后,即可进入模型试用页面,免费试用5次模型预测。支持从本地上传文件进行预测,首次试用模型预测预计需要3~5分钟。试用模型效果满意可点击“前往PAI EAS部署”将模型部署为服务。(如何部署PAI EAS服务参考EAS部署,PAI EAS模型服务将收取费用,收费标准参考EAS定价

子账号授权

PAI自动学习平台支持子账号授权,如创建实例、模型训练、图片标注等等。需要授权给子账号赋予不同权限时,可以参考子账号授权文档