本文为您汇总了异构计算产品的最佳实践,您可以根据自身业务场景选择查看。
GPU云服务器
- 在GPU实例上部署NGC环境
以搭建TensorFlow深度学习框架为例,介绍如何在GPU实例上部署NGC环境。
- GPU AI模型训练最佳实践
适用于AI图片训练场景,使用CPFS/NAS作为共享存储,利用容器服务Kubernetes版管理GPU云服务器集群进行AI图片训练。
- 在GPU实例上使用RAPIDS加速机器学习任务
在GPU实例上基于NGC环境使用RAPIDS加速库,加速数据科学和机器学习任务,提高计算资源的使用效率。
- RAPIDS加速机器学习最佳实践
适用于使用RAPIDS加速库和GPU云服务器来对机器学习任务或者数据科学任务进行加速的场景。相比CPU,利用GPU和RAPIDS在某些场景下可以取得非常明显的加速效果。
- 在GPU实例上使用RAPIDS加速图像搜索任务
使用RAPIDS加速图像搜索任务为例,介绍如何在预装镜像的GPU实例上使用RAPIDS加速库。
- RAPIDS加速图像搜索最佳实践
适用于使用RAPIDS加速平台和GPU云服务器来对图像搜索任务进行加速的场景。相比CPU,利用GPU和RAPIDS在图像搜索场景下可以取得非常明显的加速效果。
神龙AI加速引擎AIACC
- 使用AIACC-Training(AIACC训练加速)加速BERT Finetune模型
适用于自然语言训练场景,使用GPU云服务器和极速型NAS进行BERT Finetune模型训练,使用AIACC-Training(AIACC训练加速)可以有效提升多机多卡的训练效率。
集群极速部署工具FastGPU
- 使用FastGPU进行极速AI训练
本教程利用FastGPU工具一键构建阿里云上的AI训练环境,并使用AIACC加速工具进行加速。
- 使用FastGPU一键部署并训练应用
在开发者实验室中,阿里云为您提供了FastGPU训练场景的相关实验教程,您可以通过教程提供的真实环境,体验并完成所需教程的学习和实验。
GPU容器共享技术cGPU
- 使用ACK服务实现GPU成本优化
适用于在利用阿里云容器服务ACK部署GPU集群后,出于成本优化的考虑,对于集群中GPU利用率不高的应用,使用GPU容器共享技术cGPU让一定数量的应用共享一张GPU卡,从而提高利用率。对于GPU利用率较高的应用,则不做改动。实现了灵活管理的同时降低整体成本。
FPGA云服务器
- FPGA RTL开发流程最佳实践
- RTL工程目录介绍
介绍RTL(Register Transfer Level)开发平台所使用的工程模式及目录,并提供示例框架帮助您理解并使用RTL。
- f3实例RTL开发最佳实践
介绍基于f3实例的RTL(Register Transfer Level)开发流程。
- RTL工程目录介绍
- FPGA OpenCL开发流程最佳实践
- f3 SDAccel开发环境介绍
FaaS f3 SDAccel开发环境以Xilinx SDAccel dynamic 5.0版本为原型,您可以基于OpenCL进行开发以及应用。本文为您简要介绍f3实例的SDAccel开发环境。
- f3实例OpenCL开发最佳实践
在f3实例上使用OpenCL(Open Computing Language)制作镜像文件,并烧录到FPGA芯片中。
- f3 SDAccel开发环境介绍