CPFS智算版文件系统与对象存储OSS之间已实现数据流动。您可以通过创建数据流动任务实现不同源端的数据同步。
背景信息
当CPFS智算版文件系统中的目录与OSS Bucket创建数据流动后,通过创建数据流动任务,可以完成数据的高速传输。传输完成后,您能通过高性能且POSIX兼容的文件接口快速地处理OSS中的数据。同时,CPFS智算版支持通过文件存储控制台或OpenAPI将数据导出至OSS Bucket。
目录级别的数据流动
您可以通过创建数据流动,建立从CPFS智算版文件系统任意子目录到OSS Bucket下任意prefix的映射,实现更细粒度的权限控制与更灵活的数据传输。
数据的导入与导出
您可以创建数据流动任务实现CPFS智算版文件系统与OSS之间的数据导入和导出,以便在计算任务开始前将数据同步至高性能的CPFS智算版文件系统上。如果任务执行失败,您可以通过任务报告检查失败原因。
重要CPFS智算版会将File Modification timestamps属性导出到OSS Bucket的自定义元数据中,其命名为
x-oss-meta-hbr-buckup-mtime
,不能删除或修改,否则文件系统中的File Modification timestamps属性会错误。
使用限制
数据流动
仅CPFS智算版2.4.0及以上版本支持数据流动。
单个CPFS智算版文件系统最多支持创建10个数据流动。
单个CPFS智算版文件系统的文件路径只能与一个OSS Bucket链接。
CPFS智算版文件系统不支持与其他区域的OSS Bucket创建数据流动。
数据流动对文件系统的限制
在数据流动关联的文件系统路径中,不可对非空目录执行重命名操作,否则报错
Permission Denied
或者目录非空。目录、文件名中的特殊字符需要谨慎使用,支持大小写字母、数字、感叹号(!)、短划线(-)、下划线(_)、半角句号(.)、星号(*)和半角圆括号(())。
不支持超长路径,数据流动支持的路径最大长度是1023字符。
数据流动导入限制
Symlink类型的文件导入到CPFS智算版后,会转变为包含数据的普通文件,并丢失Symlink信息。
如果OSS Bucket存在多个版本,则只复制最新的版本。
不支持长度大于255字节的文件名或子目录名。
数据流动导出限制
Symlink类型的文件在同步到OSS后,不会同步Symlink所指向的文件,而是会变成一个普通的无数据空白对象。
Hardlink类型的文件仅作为普通文件同步到OSS。
Socket、Device、Pipe类型的文件导出到OSS Bucket时,会变成一个普通的无数据空白对象。
不支持长度大于1023字符的目录路径。
使用流程
性能指标
操作类型 | 指标 | 说明 |
导入数据 | GB级以上文件吞吐 |
|
MB级文件每秒处理个数 | 单目录、多目录导入:1000。 | |
导出数据 | GB级以上文件吞吐 |
|
MB级文件每秒处理个数 | 单目录、多目录导出:1200。 |
- 本页导读 (1)