在数据同步任务配置前,您需要确保用于执行同步任务的独享数据集成资源组与您将要同步的数据来源端与目的端数据库的网络连通性,您可以根据数据库所在网络环境,选择合适的网络解决方案来实现网络连通。本文为您介绍数据库在不同网络环境中时,可选用的网络连通方案。
背景信息

说明 如果数据库存在白名单限制,您还需要将独享数据集成资源组的EIP添加至数据库白名单。获取EIP详情请参见:添加白名单。
购买合适规格的资源组
购买并选择合适规格的独享数据集成资源组,购买详情请参见:新增和使用独享数据集成资源组。
说明
- 不同规格的资源组支持同步的任务数或并发线程数存在上限,您需要根据业务需要选择合适规格的资源组。
- 离线和实时同步任务推荐使用不同的资源组,以便任务分开执行。如果选择同一个资源组,任务混跑会带来资源抢占、运行态互相影响等问题。例如,CPU、内存、网络等互相影响,可能会导致离线任务变慢或实时任务延迟等问题,甚至在资源不足的极端情况下,可能会出现任务被OOM KILLER杀掉等问题。
配置网络连通
网络连通方案选择取决于数据库与DataWorks工作空间(独享资源组,即同步机器)间的环境关系,包括以下场景:

同步网络选择 | 数据源所在环境 | 数据源与DataWorks工作空间关系 | 网络连通通用逻辑 | 配置示例 |
---|---|---|---|---|
通过VPC(内网)同步 | 数据库在阿里云
|
同阿里云主账号、同地域![]() |
独享数据集成资源组绑定数据源所在VPC即可。 | 场景一:数据库与DataWorks工作空间同阿里云主账号、同地域 |
不在同一个同阿里云主账号下或不在同一个地域下![]() |
|
|||
数据库不在阿里云
|
![]() |
场景四:数据库在IDC | ||
通过公网访问数据库 | - | ![]() |
独享数据集成资源组有公网访问能力,可直接连通。 | - |
说明
|
各场景网络连通配置示例
下文以使用阿里云RDS数据库为例,网络连通配置如下。获取RDS的专有网络信息,详情请参见切换专有网络VPC和虚拟交换机。
说明 以下示例仅为独享资源组绑定普通安全组场景下的说明。
- 通过VPC(内网)访问数据库
场景一:数据库与DataWorks工作空间同阿里云主账号、同地域
网络连通配置操作 配置操作图示 - 网络绑定:独享数据集成资源组可绑定数据源所在VPC。
- 数据库白名单配置:将独享资源组绑定的交换机网段IP添加到数据库白名单中。
场景二:数据库与DataWorks工作空间同阿里云主账号、不同的地域
网络连通配置操作 配置操作图示 场景三:数据库与DataWorks工作空间使用不同阿里云主账号
网络连通配置操作 配置操作图示 - 数据库不在阿里云
场景四:数据库在IDC
后续步骤
- 网络连通配置。
- 完成网络连通配置后,您可根据数据库是否开启白名单设置,如果开启了白名单,则您需要将资源组相应的IP地址段添加至数据库的白名单中,避免资源组无法正常读写数据库的数据,详情可参见添加白名单。
- 如果您的数据库是ECS自建数据库,您还需安全组配置,详情可参见附录:ECS自建数据库的安全组配置。
- 数据同步任务配置,操作详情请参见以下文档。