本方案适用于使用RAPIDS加速库和GPU云服务器来对机器学习任务或者数据科学任务进行加速的场景。相比CPU,利用GPU和RAPIDS在某些场景下可以取得非常明显的加速效果。
解决的问题
- 搭建RAPIDS加速机器学习环境。
- 使用容器服务Kubernetes版部署RAPIDS环境。
- 使用NAS存储计算数据。
部署架构图

选用的产品
- GPU服务器
GPU云服务器是基于GPU应用的计算服务,多适用于AI深度学习、视频处理、科学计算、图形可视化等应用场景。
更多关于GPU服务器的介绍,请参见GPU服务器产品详情页。
- 文件存储NAS
阿里云文件存储NAS是一个可共享访问、弹性扩展、高可靠、高性能的分布式文件系统。兼容POSIX文件接口,可支持数千台计算节点共享访问,可以挂载到弹性计算ECS、弹性裸金属服务器、容器服务ACK、弹性容器ECI、批量计算BCS、高性能计算EHPC、AI训练PAI等计算业务上提供高性能的共享存储,用户无需修改应用程序,即可无缝迁移业务系统上云。
更多关于文件存储NAS的介绍,请参见文件存储NAS产品详情页。
- 容器服务 ACK
容器服务Kubernetes版(ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。
更多关于容器服务ACK的介绍,请参见容器服务 ACK产品详情页。
最佳实践详情
关于使用RAPIDS加速库和GPU云服务器对机器学习任务或者数据科学任务进行加速的更多信息,请参见RAPIDS加速机器学习的最佳实践。