AIACC-Training(AIACC训练加速)支持优化基于AI主流计算框架(包括TensorFlow、PyTorch、MxNet和Caffe)搭建的模型,能显著提升训练性能。本文介绍如何自动安装AIACC-Training(AIACC训练加速)并测试demo。
背景信息
Conda是一款开源跨平台的软件包和环境管理系统,Miniconda是一款小巧的Conda环境部署工具。创建GPU实例时支持自动安装包含AIACC-Training(AIACC训练加速)的Conda环境,您可以使用Miniconda快速选择不同的Conda环境,一键安装和切换深度学习框架,并通过AIACC-Training(AIACC训练加速)显著提升训练性能。
自动安装AIACC-Training(AIACC训练加速)
AIACC-Training(AIACC训练加速)依赖GPU驱动、CUDA和cuDNN,请在创建GPU实例时配置自动安装GPU驱动,然后选中AIACC训练加速。具体操作,请参见创建配备NVIDIA GPU的实例。

Conda环境包括AIACC-Training及OpenMPI等依赖包,但不包括深度学习框架。安装深度学习框架的具体操作,请参见选择Conda环境并安装深度学习框架。
CUDA版本决定支持安装的深度学习框架版本,对应关系如下表所示。
CUDA版本 | 默认进入的Conda环境 | 支持安装的深度学习框架版本 |
---|---|---|
CUDA 11.0 | aiacct_tr1.7.0_cu11.0_py36 | TensorFlow 2.4 |
CUDA 10.1 | aiacct_tf2.1_cu10.1_py36 | TensorFlow 2.1 |
CUDA 10.0 | aiacct_tf1.15_tr1.4.0_mx1.5.0_cu10.0_py36 |
|
CUDA 9.0 | aiacct_tf1.12_tr1.3.0_mx1.5.0_cu9.0_py36 | TensorFlow 1.12 + Pytorch 1.3.0 + MXNet 1.5.0 |
选择Conda环境并安装深度学习框架
删除Miniconda
如果您不需要使用AIACC-Training(AIACC训练加速),可以删除Miniconda。默认为root用户安装Miniconda,为root用户删除Miniconda即可。
在文档使用中是否遇到以下问题
更多建议
匿名提交