使用GPU实例+RAPIDS结合ACK实现端到端加速机器学习任务加速。
直达最佳实践
更多最佳实践
场景描述
本方案适用于使用RAPIDS加速库+GPU云服务器来对机器学习任务或者数据科学任务进行加速的场景。相比CPU,利用GPU+RAPIDS在某些场景下可以取得非常明显的加速效果。
解决架构
解决问题
- 搭建RAPIDS加速机器学习环境
- 使用容器服务Kubernetes版部署 RAPIDS环境
- 使用NAS存储计算数据
相关产品
- 容器服务 ACK
容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。
更多关于容器服务 ACK的介绍,参见容器服务 ACK产品详情页。
- GPU服务器
GPU云服务器是基于GPU应用的计算服务,多适用于AI深度学习,视频处理,科学计算,图形可视化,等应用场景。
更多关于GPU服务器的介绍,参见GPU服务器产品详情页。
- 文件存储NAS
阿里云文件存储NAS是一个可共享访问,弹性扩展,高可靠,高性能的分布式文件系统。兼容POSIX 文件接口,可支持数千台计算节点共享访问,可以挂载到弹性计算ECS、神龙裸金属、容器服务ACK、弹性容器ECI、批量计算BCS、高性能计算EHPC,AI训练PAI等计算业务上提供高性能的共享存储,用户无需修改应用程序,即可无缝迁移业务系统上云。
更多关于文件存储NAS的介绍,参见文件存储NAS产品详情页。