在PAI平台使用数据集加速器

PAI平台创建数据集时,支持开启AI加速:数据集加速功能。您可以在创建DSW实例或提交DLC任务时,直接使用已开启加速的数据集,提升数据读取效率。本文为您介绍如何在PAI平台使用数据集加速器。

前提条件

已创建数据集加速实例,具体操作,请参见创建及管理数据集加速实例

开启数据集加速:新建数据集

  1. 数据集页面创建数据集,并配置以下关键参数,更多详细内容,请参见创建及管理数据集

    参数

    描述

    创建方式

    选择从阿里云云产品

    开启数据集加速

    选中开启数据集加速,并配置相关参数,即可开启数据集加速功能。image

    根据已选择的数据存储类型,选择所属数据集加速实例,并配置数据集加速槽相关参数,包括加速槽名称、最大容量、加速挂载点等,配置详情请参见创建及管理数据集加速槽

  2. 单击提交

    成功创建的数据集将显示在数据集列表中,其中已开启加速功能的数据集如下图所示。image

开启数据集加速:已有数据集

  1. 数据集页面,单击数据集名称,进入数据集详情页面。具体操作请参见创建及管理数据集

  2. 数据集详情页面右上角单击数据集加速,选择所属数据集加速实例,并配置数据集加速槽相关参数。具体配置详情,请参见创建及管理数据集加速槽

  3. 单击提交,即可为该数据集开启加速功能。

使用数据集加速器

您可以在创建DSW实例或提交DLC任务时使用数据集加速器。

  • 创建DSW实例时,存储配置选择开启加速功能的数据集即可,详情请参见创建及管理DSW实例image

  • 提交DLC任务时,数据集配置选择开启加速功能的数据集即可,详情请参见创建训练任务9abfc98e31256f978dd71d41eae5902f