完成数据源、网络、资源的准备配置后,您可以创建并执行整库实时同步任务,开始进行数据同步。本文为您介绍如何创建整库实时同步任务,先将指定数据库中的部分或全部表的数据离线同步至ElasticSearch中,再将后续新增的数据实时同步至ElasticSearch中,并在创建完成后查看任务运行情况。
前提条件
创建数据同步任务前,需检查已完成以下准备操作。
背景信息
您可以使用通过Elasticsearch全托管方式提供的冷热存储方案存储企业的实时数据。基于该功能,DataWorks为您提供了整库实时同步数据至Elasticsearch的解决方案,轻松助力企业实现同步整库数据至Elasticsearch后,再将持续新增的数据实时同步至ElasticSearch中。同时,您可以实时查看创建的同步任务详情,监控任务的运行状况及业务库数据的更新情况,用于后续做数据检索、数据分析或数据开发。
整库实时同步数据的优势如下:
- 整库级别同步。
无需逐个创建表级别的数据同步任务,支持直接创建库级别的同步任务,选择目标库的部分或全部表数据进行同步。
- 同步规则配置灵活。
您可以根据业务需求灵活配置不同DDL消息的处理规则。例如,针对来源端删除表的DDL消息,如果您将同步数据的处理方式配置为忽略,则进行实时同步时,DataWorks收到相关删除表的DDL消息时,会忽略该类消息,目标端的对应表则不会被删除。
- 配置操作简单。
您无需进行创建同步任务、创建数据库、创建表、创建相互依赖以及执行参数对齐等复杂操作,通过简单的产品配置向导,即可完成对应功能的配置。
- 实现海量数据的实时更新,自动化运维管理效率较高。
适用场景
适用于需要实时监测业务库数据的更新情况,便于上层应用对实时数据进行检索分析或数据开发的场景。
使用限制
- 目前仅支持整库实时同步MySQL类型的数据库至ElasticSearch。
- 整库实时同步解决方案仅支持使用独享资源组。
创建整库实时同步任务
执行整库实时同步任务
在解决方案任务列表页面,单击相应任务后的提交执行,运行创建的整库实时同步任务。
查看任务运行状态及结果
- 在解决方案任务列表页面,选择已运行任务后的 ,查看当前解决方案整库实时同步任务过程中,各子任务节点的运行详情。
- 单击子任务节点后的执行详情,可以单击对话框中的任务链接,进入子节点的数据开发页面。
管理整库实时同步任务
- 查看或编辑任务。
在解决方案任务列表页面,单击相应任务后的 ,查看或编辑任务。说明 仅单击未运行状态后的 ,您可以编辑任务。其它状态下的任务配置页面,仅支持查看。
- 修改任务优先级。
单击相应任务后的修改优先级对话框中,输入需要配置的优先级数值,单击确定。优先级取值范围为1~8,数值越大优先级越高。。在说明 优先级相同的任务,按照提交时间的先后顺序执行。
- 删除任务。
单击相应任务后的确认。。在删除对话框中,单击说明 仅删除当前任务的配置记录,已经生成的表和任务不受影响。
在文档使用中是否遇到以下问题
更多建议
匿名提交