AI数据集模型训练推理加速-AI加速-人工智能平台 PAI-阿里云

文档备案控制台

输入文档关键字查找

PAI-AI加速器主要用于训练加速和推理加速，通过多种手段如数据集加速、计算加速等，提高了AI训练和推理的速度、易用性和稳定性，全面提升了AI计算的效率。本文为您介绍AI加速器的功能亮点。

AI加速器功能简介

AI加速器支持的技术手段及对应的功能如下：

技术手段	功能概览
DataSetAcc（数据集样本访问的加速服务）	支持Kubernetes Native，多种存储介质和文件类型，生命周期管理。易用，代码无需修改，无侵入性。加速存算分离场景下I/O性能。
TorchAcc（模型训练加速框架）	支持数据并行训练，优化计算和通信overlap，提升分布式训练效果。支持AMP训练加速和自动显存优化。
EPL（大规模分布式训练框架）	支持数据并行和算子拆分流水并行。支持自动并行策略，得到最优分布式训练性能。
Rapidformer（Transformer训练加速）	优化PyTorch版Transformer模型训练，融合多种优化技术，无缝对接Transformer模型库。
PAI-Blade（通用推理优化）	支持TensorFlow、PyTorch及主流加速设备（GPU、CPU、端侧设备）。支持计算图优化、厂商优化库、AI编译优化、高性能算子库、混合精度及自动压缩等多种优化技术。易用，标准Python SDK，一个接口即可完成优化。

使用AI加速器

您可以参考以下文档链接快速接入AI加速器并体验加速效果：

DataSetAcc（数据集样本访问的加速服务）
主要解决云上AI加速-数据集加速的场景。更多信息，请参见数据集加速器概述。
TorchAcc（模型训练加速框架）
基于PyTorch的训练加速框架，提高模型训练效率。更多信息，请参见分布式训练加速TorchAcc概述。
EPL（大规模分布式训练框架）
高效易用的分布式模型训练框架，实现低成本、高性能分布式模型训练。更多信息，请参见AI加速：使用EPL实现AI训练加速。
Rapidformer（Transformer训练加速）
一款PyTorch版的针对Transformer系列模型的训练优化工具，通过加速开关组合优化技术，优化PyTorch版Transformer模型的训练过程，提高训练速度和效率。更多信息，请参见训练加速（Rapidformer）概述。
PAI-Blade（通用推理优化）
通用推理优化工具，结合多种优化技术，优化训练完成的模型，以达到最优推理性能。更多信息，请参见推理加速（Blade）概述。

上一篇：PAI ArtLab 常见问题下一篇：灵骏智算本地缓存加速

该文章对您有帮助吗？