在PAI平台使用缓存加速
更新时间:
本文介绍如何在PAI Serverless平台为AI任务开启和使用缓存加速功能。该功能基于EFC弹性文件客户端,通过利用计算节点的本地存储构建高速缓存,为读密集型任务提供加速,能够显著提升模型训练和推理效率。
使用说明
存储支持:支持对象存储OSS 、文件存储NAS和文件存储CPFS智算版。
适用资源:在PAI平台,该功能目前仅适用于灵骏智算资源,请注意,开启缓存后会占用算力节点一定的资源(CPU和内存)。
加速目标:该功能核心目标是提升数据读取性能,不加速写操作。
工作机制:在多轮训练时,第一轮需要从存储实例(例如: OSS、 NAS、智算CPFS)拉取数据,性能与直读存储一致。从第二轮开始,将命中本地缓存,从而显著提升读取速度。
容量与策略:最大缓存容量与您选择的灵骏智算规格相关。缓存淘汰策略采用LRU(最近最少使用)。
数据可靠性:缓存旨在提升性能,不保障数据的持久化和高可用性。在某些异常情况(如节点宕机、宿主机故障等)下,缓存数据可能会丢失。请务必将原始数据存储在NAS、OSS等高可靠的存储服务中,不要将缓存作为唯一的存储介质。
使用方法
在 PAI Serverless 平台,您可以通过控制台一键开启本地缓存加速能力。
开启资源配额(Quota)本地缓存。在左侧导航栏单击资源配额(Quota)> 灵骏智算资源,找到并单击目标Quota名称进入管理页面。开启本地缓存,并设置需要缓存的存储路径。
如果是多级嵌套的资源配额,需保证第一级资源配额(Quota)已开启本地缓存。

使用目标资源配额的灵骏资源创建DLC任务,并开启使用缓存。当挂载的存储地址命中步骤1中填写的缓存地址时,默认加速(用户可选择关闭)。

该文章对您有帮助吗?