什么是人工智能平台PAI

人工智能平台PAI(Platform For AI),是阿里云专为开发者打造的一站式机器学习平台,为您提供数据标注、模型开发、模型训练、模型部署的AI全链路研发服务。本文为您介绍什么是人工智能平台PAI。

前置概念

阅读本文前,可以按需了解基础概念:什么是人工智能(AI)?

什么是人工智能平台PAI

人工智能平台PAI是阿里云专为开发者打造的一站式机器学习平台,其主要由可视化建模(Designer)、交互式建模(DSW)、分布式训练(DLC)、模型在线服务(EAS)等核心功能模块组成,为您提供数据标注、模型开发、模型训练、模型部署的AI全链路研发服务,具有支持多种开源框架、多项AI优化能力、灵活易用的优势。

核心功能模块

名称

描述

适用场景

示例

可视化建模(Designer)

通过拖拽的方式排布组件,可视化地构建AI工作流,实现模型开发

模型代码开发、模型训练、工作流开发阶段,或需要定时调度工作流

image

交互式建模DSW(Data Science Workshop)

集成了Notebook、VSCode、Terminal多种开发环境的云端IDE

模型代码开发和训练阶段

image

分布式训练DLC(Deep Learning Containers)

云原生的AI训练平台,能够处理大规模的分布式深度学习任务

代码开发完成后的模型训练或代码执行阶段,需要多机器分布式执行时

image

模型在线服务EAS(Elastic Algorithm Service)

用于将模型部署为在线服务,具有弹性伸缩、版本管理、资源监控功能

模型训练完成需要部署为在线服务时

image

PAI完整的功能特性,请参见功能特性

产品优势

  • AI 研发全生命周期全链路

    • 支持数据标注、模型开发、模型训练、模型优化、模型部署以及AI运维管控,是一站式AI平台。

    • 拥有140+种优化的内置算法组件。

    • 提供多种模式、大数据引擎深度结合、多框架兼容、自定义镜像等核心能力。

    • 提供云原生架构的AI开发、训练、部署的产品。

  • 支持多种开源框架

    • 流式计算框架Flink。

    • 基于开源版本深度优化的深度学习框架TensorFlow、PyTorch、MegatronDeepSpeed。

    • 千亿级特征样本的大规模并行计算框架Parameter Server。

    • Spark、PySpark、MapReduce等业内主流开源框架。

  • 业内领先的AI优化

    • 高性能的训练框架,稀疏训练场景,支持数十亿到数百亿的稀疏特征规模,数百亿到数千亿的样本规模,上千worker的分布式增量训练。

    • 主流框架模型加速,使用PAI Blade提升RestNet50、Transformer+LM等十数个主流模型加速比。

  • 多样的产品输出方式

    • 公共云支持全托管、半托管。

    • 支持AI 高性能计算集群和轻量化输出产品形态。

  • 对接DataWorks

    • 支持SQL、UDF、UDAF、MR等多种数据处理方式,灵活性高。

    • 支持DataWorks周期性调度,且调度任务区分生产环境和开发环境,从而实现数据安全隔离。