文档

在PAI平台使用数据集加速器

更新时间:

PAI平台创建数据集时,支持开启AI加速:数据集加速功能。您可以在创建DSW实例或提交训练任务时,直接使用已开启加速的数据集,提升数据读取效率。本文为您介绍如何在PAI平台使用数据集加速器。

前提条件

已创建数据集加速实例,具体操作,请参见创建及管理数据集加速实例

开启数据集加速:新建数据集

  1. 数据集管理页面创建数据集,并配置以下关键参数,更多详细内容,请参见创建及管理数据集

    参数

    描述

    创建方式

    选择从阿里云云产品

    • 选择数据存储配置为阿里云对象存储(OSS)属性文件夹时,支持开启数据集加速。

    • 选择数据存储配置为阿里云文件存储(NAS),且选择NAS文件系统配置为已创建的CPFS文件系统时,支持开启数据集加速。

    开启数据集加速

    选中开启数据集加速,并配置相关参数,即可开启数据集加速功能。image

    • 其中:

      • 所属实例:选择已创建的数据集加速实例。

      • 加速槽名称:默认配置为数据集名称,您也可以自行配置。

      • 最大容量:配置数据集加速槽容量。该容量需要大于等于数据集容量,您可以参考需要加速的具体数据集容量来配置。

      • 加速数据集默认挂载路径:数据的默认挂载路径。

      其他参数配置,详情请参见创建及管理数据集

  2. 单击提交

    数据集创建成功后,在数据集列表中展示,开启加速功能的数据集如下图所示。image

开启数据集加速:已有数据集

  1. 数据集管理页面,单击数据集名称,进入数据集详情页面。具体操作请参见创建及管理数据集

    说明

    您需要选择支持开启数据集加速的数据集,详情请参见开启数据集加速:新建数据集

  2. 数据集详情页面右上角单击数据集加速,选择所属实例,配置加速槽名称最大容量加速数据集默认挂载路径

  3. 单击提交,可在数据集页面查看到加速数据集。

使用数据集加速器

您可以在创建DSW实例或提交容器训练任务时使用数据集加速器。

  • 本页导读 (1)
文档反馈