使用OSS-HDFS服务的回收站功能时,客户端在执行删除操作时会先将待删除文件移动至特定回收站目录,然后由服务端按照预定策略自动清理该回收站目录下的数据。
删除文件说明
当您从OSS-HDFS服务非强制删除文件时,文件不是被立即删除,会先被挪到
/user/<username>/.Trash/Current
目录下。当经过30分钟后,Current目录下文件会被挪到
/user/<username>/.Trash/<timestamp>
目录下。说明某一时间段内被删除的文件,会被归类到一个带时间戳的目录下,表示是在这个时间内被删除的,相当于一次Checkpoint。
当经过3天后,这个目录将会被永远删除。
因此在3天内,您有机会从.Trash
目录下找到对应时刻被删除的文件,将其从.Trash
挪出,从而恢复它。
回收站功能是由客户端和服务端配合形成。客户端负责将待删除文件挪到.Trash
目录下;服务端默认开启定时清理,负责维护/user/<username>/.Trash
目录下的定时清理。
Hadoop FileSystem Shell使用回收站功能
在Hadoop FileSystem Shell中,客户端默认开启回收站功能。
仅OSS-HDFS支持使用回收站功能,OSS不支持使用回收站功能。
执行以下删除命令,文件移至回收站,服务端负责清理。
hadoop fs -rm oss://examplebucket.cn-hangzhou.oss-dls.aliyuncs.com/a/b/c
客户端会自动将删除请求转化为移动操作,即
hadoop fs -mv oss://examplebucket.cn-hangzhou.oss-dls.aliyuncs.com/a/b/c /user/<username>/.Trash/Current/a/b/c
命令。这样,您无需显式管理回收站功能,服务端会负责清理。使用以下两种方式彻底删除文件并释放存储空间,文件不会移至回收站。
方式一:执行强制删除命令。
hadoop fs -rm -f oss://examplebucket.cn-hangzhou.oss-dls.aliyuncs.com/a/b/c
方式二:执行删除命令时添加-skipTrash参数。
hadoop fs -rm -skipTrash oss://examplebucket.cn-hangzhou.oss-dls.aliyuncs.com/a/b/c
Hadoop生态组件使用回收站功能
Hive、Spark和Flink等组件并不感知OSS-HDFS服务回收站功能的存在,使用FileSystem(HDFS)的Delete接口意味着立即删除。
OSS-HDFS采取了跟开源Hadoop相似的策略。如果您需要使用回收站功能,需要显式地调用FileSystem的rename接口,将目标文件手动挪到/user/<username>/.Trash/Current
目录下,由OSS-HDFS服务端负责定期删除。