搭建AI训练的容器环境,利用飞天AI加速工具进行AI模型训练加速。

直达最佳实践

点击查看最佳实践详情

更多最佳实践

点击查看更多阿里云最佳实践

场景描述

本方案适用于AI图片训练场景,使用CPFS/NAS作为共享存储,利用容器服务Kubernetes版管理GPU云服务器集群进行图片AI训练。

解决的问题

  • 搭建AI图片训练基础环境
  • 使用CPFS存储训练数据
  • 使用飞天AI加速训练服务加速训练
  • 使用Arena一键提交作业

部署架构图

GPU AI模型训练