通过阿里数据传输中的数据同步(DTS),将RDS的数据实时传输至DataHub中。
- 创建DataHub项目。
- 登录DataHub控制台。
- 在项目管理中,选择区域,本案例选择华东1区。
- 单击创建Project,输入名称和描述,创建一个DataHub项目。本案例的项目名称为datahub_test_datav。
- 配置DTS数据同步作业。
- 登录DTS控制台。
- 选择 。
- 选择同步作业的基本配置。本案例的配置如下图所示,其中源实例选择MySQL,源实例地域选择华东1区,目标实例选择DataHub。
- 返回数据同步页面,单击实例右侧的配置同步链路。
- 选择同步通道的源及目标实例,完成后单击授权白名单并进入下一步。
系统会自动为您创建同步账号,创建过程需要30秒左右,请耐心等待。当进度条显示为100%时,单击下一步。 - 选择同步对象,单击>图标按钮,此时需要同步的对象会出现在已选择对象列表中。本案例的同步对象为datav_test数据库中的mytable表,如下图所示。
- 单击预检查并启动,预检查成功后,系统会自动跳转回数据同步页面。正常情况下,可以看到实例的状态为初始化中或同步中,且延时为0毫秒。
- 查看数据采集结果。
- 回到DataHub控制台,查看通过DTS创建的数据结构是否有缺失。
- 在RDS数据库中插入一条数据,单击数据抽样,查看增量数据同步结果。
注意- DataHub同步的是增量数据,您的数据库中必须插入、删除或更新一条或多条数据后,才会同步到DataHub中。本案例采用手动插入数据的方法,但在实际情况中,都是将用户的购买行为,通过程序的方式动态同步到数据库中的。
- 进行数据抽样时,指定的时间必须在您插入数据之前。
- 参考创建 MySQL 到 MaxCompute 数据实时同步作业的同步原理章节,了解DataHub中各字段的含义。
- 回到DataHub控制台,查看通过DTS创建的数据结构是否有缺失。