阿里云机器学习平台支持深度学习框架,同时提供了功能强大的GPU计算集群。您可以使用这些框架及硬件资源来使用深度学习算法。

前提条件

已创建项目,详情请参见创建项目

背景信息

深度学习支持的框架包括TensorFlow(兼容开源TF1.4和1.8版本)、MXNet 0.9.5和Caffe rc3。TensorFlow和MXNet支持用户自己编写的Python 代码,Caffe支持用户自定义网络文件。

在使用深度学习框架训练数据之前,需要上传训练的数据至阿里云对象存储OSS中,算法在运行时从指定的OSS目录中读取数据。算法在执行时访问同一区域下OSS中数据时不产生流量费用,访问其它地域的OSS会产生流量费用。
说明 阿里云机器学习目前仅在华东2(上海)华北2(北京)部署了GPU集群。

开通深度学习

在相应项目下勾选GPU资源即可使用深度学习。

  1. 登录PAI控制台
  2. 在左侧导航栏,选择模型开发和训练 > Studio-可视化建模
  3. PAI可视化建模页面,打开已创建项目所在行的开启GPU开关。GPU

    开通GPU资源的项目会被分配到公共的资源池,可以动态地调用底层的GPU计算资源。