随着企业的数据资料持续积累,需要持久化地保留数据资产,但是数据的存储成本居高不下,因此DMS和AnalyticDB PostgreSQL版Serverless模式共同推出了数据归档功能,可以面对数据库实现灵活低价、归档管理和高分析性能的能力。

功能介绍

DMS目前支持用户对企业主要的生产日志,交易等业务数据进行灵活的数据归档。AnalyticDB PostgreSQL版 Serverless模式实例作为数据归档引擎具有以下优势:

  • 支持表级归档、自定义归档条件、归档过程数据映射和归档清理等主流归档能力。
  • 支持自定义周期性归档,可满足审计、历史数据分析的数据归档诉求。
  • 当您选中成本最优时,可以实现归档时自动启动实例、归档后自动暂停实例。大幅优化了OLAP引擎作为归档引擎时的成本浪费,保证了计算按需启动。
  • AnalyticDB PostgreSQL版Serverless模式具有极强地数据分析性能,相较于OSS等存储介质,可帮助用户结构化地管理归档数据,同时按需对归档数据进行高效分析。
  • 支持直接使用AnalyticDB PostgreSQL版分析归档数据。
AnalyticDB PostgreSQL版支持将以下数据源的数据进行归档:
  • RDS MySQL
  • PolarDB MySQL引擎
  • PolarDB-X
  • AnalyticDB MySQL 3.0
  • RDS PostgreSQL
  • PolarDB PostgreSQL引擎

数据归档方案对比

归档方案性价比数据管理的易用性数据查询以及分析能力
使用OLTP数据库进行数据归档较差优秀中等
使用对象存储OSS进行数据归档优秀较差较差
使用传统OLAP引擎进行数据归档较差优秀优秀
使用AnalyticDB PostgreSQL版Serverless模式进行数据归档优秀优秀优秀

前提条件

  • 已创建AnalyticDB PostgreSQL版Serverless模式实例,作为归档目标库。如何创建实例,请参见创建实例
  • 已为归档目标库创建账号。具体操作,请参见创建数据库账号

注意事项

  • 若在数据归档过程中选择了自动清理源库表数据,请注意源库表空间的预留情况,避免由于空间不足导致归档过程中出现异常。
  • 支持存储弹性模式和Serverless模式两种实例资源类型的AnalyticDB PostgreSQL版
  • 推荐您使用资源类型为Serverless模式作为目标数据归档引擎,可以享受超低存储价格和高性能数据分析,同时,在后续创建数据归档工单过程中,选中成本最优,可以实现归档时自动启动实例、归档后自动暂停实例。
  • 源库和目标库的管控模式均为安全协同,才可执行周期归档任务,否则归档任务可能会失败。变更管控模式的操作,请参见变更管控模式
  • 若您仅需要单次执行归档任务,则不限制数据库的管控模式。

第一步:进入数据归档

  1. 登录云原生数据仓库AnalyticDB PostgreSQL版控制台
  2. 在控制台左上角,选择实例所在地域。
  3. 找到目标实例,单击实例ID。
  4. 基本信息页面,单击右上角的登录数据库
  5. 登录实例页面,输入数据库账号数据库密码
  6. 单击登录
  7. 在顶部菜单栏中,选择解决方案 > 数据归档

第二步:创建数据归档任务

  1. 在顶部菜单栏中,选择解决方案 > 数据归档
  2. 新建数据归档工单页面,配置工单信息。
    配置项是否必填说明
    任务名请输入明确、清晰的任务名,以减少沟通成本。
    归档目标选中AnalyticDB PostgreSQL
    ADB实例搜索并选择目标AnalyticDB PostgreSQL版实例。
    说明 若您选中了成本最优,且实例的资源类型为Serverless模式、付费的方式为按量付费时,有如下优势:
    • 归档任务开始执行时,实例自动启动。
    • 归档任务完成执行后,实例自动暂停。
    • 归档任务执行期间,实例处于运行中状态,收取计算节点费用和存储费用。费用详情,请参见费用说明
    • 归档任务执行结束后,实例处于已暂停状态,仅收取存储费用。
    数据库搜索并选择源数据库。
    归档配置
    1. 选择需要归档数据的表。
    2. 可选:输入归档数据的过滤条件。
      说明 如果您需要使用时间变量,例如,归档6个月前的数据,可以先进行变量配置
    归档表映射您可以单击表名操作列下的编辑,编辑源表归档到目标库后的表名、列信息、分库键和分区键。
    变量配置配置时间变量,请参见配置时间变量
    后置行为
    • 若您选中清理原表已归档数据(delete-无锁),则在归档完成后,系统将自动执行归档后的源表数据删除操作,可以通过无锁数据变更的DELETE语句完成。但删除源表的同时,源库中会生成存储此次归档数据的备份临时表,请保证源库空间充足,避免空间容量不足引发实例不可用问题。

      清理备份临时表:您可以在确认数据归档完成且数据无误后,通过新建普通数据变更工单,清理源库中的备份临时表。

    • 若您未选中清理原表已归档数据(delete-无锁),则需要在数据归档成功后,手动进行源表数据删除和空间优化。
      1. 清理源表数据:通过新建普通数据变更工单清理数据库中已归档的数据。新建普通数据变更工单,请参见普通数据变更
      2. 源表空间优化:通过新建无锁变更工单完成源表空间优化。新建无锁变更工单,请参见通过无锁变更工单实现无锁结构变更
    运行方式选择运行方式,当前支持:
    • 单次执行:工单审核通过后,仅单次运行归档任务。
    • 周期调度:工单审核通过后,可根据部署的周期调度执行归档任务。具体配置,请参见周期调度
  3. 单击提交申请
  4. 在弹出的归档数据预览页面,单击确定
  5. 工单审批通过后,系统自动执行数据归档任务。

    若任务执行失败,您可在工单的执行区域,单击操作列下的详情,查看归档任务日志,找出任务执行失败的原因。若是由于网络或数据库连接失败等偶然发生的问题,您也可以单击断点重试,尝试重新执行。

  6. 任务执行完成。

第三步:查询归档数据

  1. 登录云原生数据仓库AnalyticDB PostgreSQL版控制台
  2. 在控制台左上角,选择实例所在地域。
  3. 找到目标实例,单击实例ID。
  4. 如果您在配置工单参数时选择了成本最优,需要在基本信息页面,单击右上角的实例管理 > 启动实例,重启实例。
  5. 单击基本信息页面右上角的登录数据库
  6. 登录实例页面,输入数据库账号数据库密码
  7. 单击登录
  8. 在DMS控制台左侧的已登录实例列表,找到归档实例和归档数据库,双击进入数据库。
  9. SQL Console页面中,执行SELECT语句查询归档数据。
    SELECT * FROM customer;

周期调度

表 1. 调度周期配置表
配置项说明
调度周期选择调度任务的周期:
  • 小时:按设定的小时执行任务调度,需要配置定时调度。
  • :按每日一次的频率执行任务调度,需要配置每日调度的具体时间。
  • :以周为周期,每个指定天执行一次任务调度,需要配置指定时间和具体时间。
  • :以月为周期,每个指定天执行一次任务调度,需要配置指定时间和具体时间。
定时调度提供了2种定时调度的方式:
  • 固定间隔时间调度:
    • 开始时间:执行任务的开始时间。
    • 间隔时间:执行任务的间隔时间,单位为小时。
    • 结束时间:执行任务的结束时间。
    例如,配置开始时间为00:00、间隔时间为6小时、结束时间为20:59,系统将在0点、6点、12点、18点执行任务。
  • 指定时间调度:选择执行任务的目标时间点。

    例如选择和0小时和5小时,系统将在0点和5点执行任务。

指定时间
  • 如果调度周期为周,选择星期几执行任务,支持多选。
  • 如果调度周期为月,选择每月几号执行任务,支持多选。
具体时间设置执行任务流的具体时间。

例如配置02:55,系统将在指定天的02时55分执行任务。

cron表达式不需要手动配置,系统会根据您配置的周期、具体时间自动展现。