PAI-EasyVision(视觉智能增强算法包)提供多种模型的训练及预测功能,旨在帮助计算机视觉应用开发者方便快捷地构建视觉模型并应用于生产。
- 深度学习算法代码开发成本高,对大量细节进行Debug的代价很高。
- 模型更新迭代快,理解其原理和细节需要花费大量时间。
- 算法训练和推理性能优化都需要专业的系统知识。
- 数据标注成本太高。
- 在PAI上直接使用开源算法存在一定的学习和改造成本。
- 易用性方面
针对视觉任务的多样性,PAI-EasyVision支持面向多任务、模块化及可插拔的原子化功能接口,其功能涵盖了数据IO、预处理、训练及离线预测的完整建模流程。同时,您可以在PAI-Studio或PAI-DSW等多种环境中使用PAI-EasyVision。
- 性能方面
算法封装了PAI-TF的多种优化引擎,包括分布式训练、编译优化及混合精度等,您通过简单的配置文件即可在PAI中享受极致的性能体验。同时,兼容在开源TF中使用PAI-EasyVision。
- 模型丰富度方面
提供了大量在开源数据集上训练完成的模型,且集成了PAI中优秀的模型(例如OCR模型),进而降低开发和训练成本。
架构

特性
- 易用性
考虑到用户分层,有些用户希望通过简单的交互操作完成模型训练,有的用户希望定时调度模型训练和预测任务,有的用户希望复用PAI-EasyVision已有模块,在此基础上进行模型结构调整,再重新训练。因此,PAI-EasyVision支持通过PAI-VIP、PAI命令或PAI-DSW方式调用。
- 性能优化
依托PAI-TF团队进行了分布式训练性能优化,支持高性能的单机多卡、多机多卡分布式运行方式。同时支持对模型进行Inference阶段优化,包括图优化及模型压缩等方式。
- 对接PAI标记平台
PAI-EasyVision对接PAI标记平台,您可以通过提供的转换工具,方便地将PAI标记格式文件转换为TFRecord,从而进行相关任务训练。此外,PAI-EasyVision提供了丰富的数据增强模块,用于在训练时动态扩充训练数据。
- 高效的离线预测
PAI-EasyVision提供多机流水线的预测系统,便于将PAI-EasyVision训练的模型进行离线数据处理。每个处理过程支持多机多线程加速,且各个过程异步流水线处理,极大提高了处理效率。此外,离线预测支持用户自定义各个处理过程。
- 对接在线服务平台PAI-EAS
训练过程会产出SaveModel,用户可以自行接入原有的在线预测业务系统。 同时,PAI-EAS提供了强大的在线预测服务能力,实现了PAI-EasyVision EAS Python Processor,用户只需要在配置文件中配置模型地址及模型类别信息,即可进行实时数据处理。