文档

深度学习框架及开通说明

更新时间:

阿里云机器学习平台支持深度学习框架,同时提供了功能强大的GPU计算集群。您可以使用这些框架及硬件资源来使用深度学习算法。

前提条件

已关联MaxCompute资源,具体操作,请参见管理工作空间

背景信息

深度学习支持的框架包括TensorFlow(兼容开源TF1.12版本)。TensorFlow支持用户自己编写的Python代码。

在使用深度学习框架训练数据之前,需要上传训练的数据至阿里云对象存储OSS中,算法在运行时从指定的OSS目录中读取数据。算法在执行时访问同一区域下OSS中数据时不产生流量费用,访问其它地域的OSS会产生流量费用。

说明

阿里云机器学习目前仅在华东2(上海)华北2(北京)华东1(杭州)华南1(深圳)部署了GPU集群。

开通深度学习

在相应工作空间内,配置GPU资源即可使用深度学习。

  1. 登录PAI控制台

  2. 在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。

  3. 工作空间详情区域,单击计算资源后的资源管理

  4. 工作空间资源配置面板,按照下图操作指引,打开资源配置对话框。image.png

  5. 资源配置对话框,配置GPU参数为按量付费,并单击确定开启GPU

使用深度学习框架TensorFlow

TensorFlow当前仅支持提交CPU任务,使用详情请参见TensorFlow使用指南

如需提交GPU任务,请通过Python脚本组件配置。