开发流程

进入工作空间后,您可以使用PAI子产品进行AI开发。本文介绍如何快速上手并使用PAI及常用的AI开发流程,您可以结合实际情况选择。

快速开始

您可以通过快速开始快速上手并体验PAI的训练和部署流程,详情请参见快速开始概述

如果您想更详细地了解并使用PAI的子产品(DesignerDSWDLCEAS等),详情请参见AI开发流程

AI开发流程

进入工作空间后,在左侧导航栏可以看到PAI的全部子产品模块。您需要根据实际开发场景进行机器学习全生命周期的开发和管理。常见的使用场景如下所示,您可以按照流程引导,使用子产品模块:

  • 云原生开发场景

    image

    区域

    描述

    相关文档

    高质量的数据集是高精度模型的基础,也是数据准备的核心目标。您可以通过数据集管理模块将本地数据、阿里云存储中的数据以及公共数据集进行注册,也可以通过扫描OSS文件夹生成索引数据集,从而统一管理PAI的相关数据,为数据标注及模型训练环节做好准备。

    创建及管理数据集

    DSW是为AI开发者量身定制的云端机器学习交互式开发IDE,可以随时随地开启Notebook快速读取数据、开发算法、训练及部署模型。

    DSW概述

    镜像管理模块为您展示PAI提供的官方公开镜像以及自定义镜像关联功能,从而在PAI中统一管理应用的镜像。

    自定义镜像

    云原生一站式的深度学习训练平台,提供灵活、稳定、易用和高性能的机器学习训练环境。支持多种算法框架,超大规模分布式深度学习任务的运行以及自定义算法框架。

    DLC概述

    为了方便您在提交任务时指定所需的数据集和代码仓,PAI支持添加文件系统NAS或对象存储OSS的数据集以及Git代码仓。

    准备工作

    模型管理模块统一管理训练完成的模型,并直接对接模型在线服务(EAS)。您可以将模型直接部署为在线服务。

    注册及管理模型

    PAI平台的模型在线预测服务,支持异构硬件(CPUGPU)模型加载,高吞吐低延迟,大规模复杂模型一键部署及实时弹性扩缩容。

    说明

    目前EAS产品不支持使用DSW镜像和CPFS类型的数据集。

    EAS概述

  • AI+大数据最佳实践

    image

    区域

    描述

    相关文档

    使用MaxCompute存储数据,首先在DataWorks中对数据进行预处理,然后PAI引用MaxCompute表作为数据源进行模型训练。

    Designer支持大规模分布式的传统机器学习、深度学习、强化学习训练,支持流批一体训练,该子模块封装了上百种机器学习算法,您可以拖拽式建模、自动调参,从而无编程玩转人工智能。

    Designer概述

    DataWorks根据配置的调度和时间属性等参数,周期调度任务。

    任务管理支持将Designer的实验数据或自定义任务的执行信息记录到PAI提供的任务管理服务中,从而便于进行任务间的实验比较。

    任务管理

    模型管理模块统一管理训练完成的模型,直接对接模型在线服务(EAS),您可以直接将模型部署为在线服务。

    注册及管理模型

    PAI平台的模型在线预测服务,支持异构硬件(CPUGPU)模型加载,高吞吐低延迟,大规模复杂模型一键部署及实时弹性扩缩容。

    说明

    目前EAS产品不支持使用DSW镜像和CPFS类型的数据集。

    EAS概述