本文为您介绍MaxCompute表的生命周期概念。

MaxCompute表的生命周期(Lifecycle),指表(分区)数据从最后一次更新的时间算起,在经过指定的时间后没有变动,则此表(分区)将被MaxCompute自动回收。这个指定的时间就是生命周期。

  • 生命周期单位:Days(天),只接受正整数。
  • 对于非分区表,如果表数据在生命周期Days天内没有被修改,经过Days天后此表将会被MaxCompute自动回收(类似DROP TABLE操作)。生命周期从最后一次表数据被修改的时间(LastDataModifiedTime)起开始计算。
  • 对于分区表,每个分区可以分别被回收。在生命周期Days天内数据未被修改的分区,经过指定的天数后此分区将会被回收,否则会被保留。每个分区的生命周期是从最后一次分区数据被修改的时间LastDataModifiedTime起开始计算。不同于非分区表,分区表的最后一个分区被回收后,该表不会被删除。
    说明

    生命周期回收为每天定时启动,扫描全量分区。扫到时,Last modify time需超过Lifecycle指定的时间才回收。

    假设某个分区表生命周期为1天,该分区数据最后一次被修改的时间是17号15点0分。如果18号的回收扫描在15点前扫到这个表(不到一天),则不会回收上述分区。如果19号回收扫描时发现这个表的这个分区Last modify time超过Lifecycle指定的时间,则上述分区会被回收。

  • 生命周期只能设定到表级别,不能在分区级设置生命周期。创建表时即可指定生命周期。
  • 如果您没有为表指定生命周期,则表(分区)不会根据生命周期规则被MaxCompute自动回收。

关于建表时如何指定、修改表生命周期、修改表LastDataModifiedTime等操作,请参见表操作