使用GPU实例+RAPIDS结合ACK实现端到端加速机器学习任务加速。

直达最佳实践

点击查看最佳实践详情

更多最佳实践

点击查看更多阿里云最佳实践

场景描述

本方案适用于使用RAPIDS加速库+GPU云服务器来对机器学习任务或者数据科学任务进行加速的场景。相比CPU,利用GPU+RAPIDS在某些场景下可以取得非常明显的加速效果。

解决架构

结构架构图

解决问题

  • 搭建RAPIDS加速机器学习环境
  • 使用容器服务Kubernetes版部署 RAPIDS环境
  • 使用NAS存储计算数据

相关产品

  • 容器服务 ACK

    容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。

    更多关于容器服务 ACK的介绍,参见容器服务 ACK产品详情页

  • GPU服务器

    GPU云服务器是基于GPU应用的计算服务,多适用于AI深度学习,视频处理,科学计算,图形可视化,等应用场景。

    更多关于GPU服务器的介绍,参见GPU服务器产品详情页

  • 文件存储NAS

    阿里云文件存储NAS是一个可共享访问,弹性扩展,高可靠,高性能的分布式文件系统。兼容POSIX 文件接口,可支持数千台计算节点共享访问,可以挂载到弹性计算ECS、神龙裸金属、容器服务ACK、弹性容器ECI、批量计算BCS、高性能计算EHPC,AI训练PAI等计算业务上提供高性能的共享存储,用户无需修改应用程序,即可无缝迁移业务系统上云。

    更多关于文件存储NAS的介绍,参见文件存储NAS产品详情页