为了保证DataWorks中数据同步、数据调度等任务的顺利操作,还需要确保资源组绑定的VPC网络与数据源(目标网络环境下的数据库、数据服务或其他数据)之间的连通性,本文为您提供了不同网络环境下的网络连通解决方案。
背景信息
在DataWorks数据同步、数据开发、数据调度等任务中,如果涉及访问的数据源不在当前DataWorks资源组绑定的VPC中(例如数据源在其他VPC或IDC中),需要根据不同网络情况,请选择合适的网络连通方案,使DataWorks资源组绑定的VPC与数据源所在网络连通。
例如,在数据同步流程中,需要资源组绑定的VPC网络与数据来源端、数据去向端进行网络连通。
前提条件
已购买合适规格的资源组,购买详情请参见:新增和使用Serverless资源组。
资源组的更多介绍,请参见DataWorks资源组概述。
本文提供的网络连通方案仅适用于Serverless资源组、旧版资源组中的独享数据集成资源组、独享调度资源组和独享数据服务资源组。
为了加强DataWorks功能间的资源管理和统一用户体验,DataWorks推出Serverless资源组,涵盖了旧版资源组(原独享调度资源组、独享数据集成资源组、独享数据服务资源组)的核心功能,通过一个资源组即可完成数据同步、任务调度运行、调用及管理API服务等操作。推荐购买Serverless资源组,更多信息,请参见新增和使用Serverless资源组。
注意事项
资源组与数据源可连通是后续任务运行成功的必要条件之一。
暂不支持资源组与经典网络环境进行数据交互,建议您将经典网络环境下的数据源或业务迁移至专有网络VPC环境。
无法保障公网环境下各任务的速度和稳定性,建议通过内网或者云企业网同步。
Serverless资源组可通过绑定专有网络的方式在内网访问复杂网络环境下的数据源或地址。但Serverless资源组默认不具备公网访问能力,如果需要通过公网访问数据源或网络,请为Serverless资源组绑定的VPC配置公网NAT网关和EIP。具体操作,请参见场景五:数据源在公网。
配置网络连通
步骤一:网络绑定
网络连通方案选择取决于数据源与DataWorks工作空间资源组之间的环境关系,包括以下场景:
网络选择 | 数据源所在环境 | 数据源与DataWorks工作空间关系 | 网络连通通用逻辑 | 配置示例 |
VPC(内网) | 在阿里云
| 同阿里云主账号、同地域 | 资源组绑定数据源所在VPC即可。 | |
| ||||
不在阿里云
| ||||
公网 | 在公网 |
|
步骤二:添加白名单
无论上述哪种场景,如果数据源存在白名单访问控制,您都需要将资源组绑定的交换机网段、旧版资源组本身EIP或Serverless资源组绑定VPC配置的EIP添加至其白名单中。
通过内网访问,请将资源组绑定的交换机网段IP添加到数据源的白名单列表。
在DataWorks控制台的资源组页面独享资源组页签下,单击目标资源组后的网络设置,查看交换机网段并将其添加至数据源的白名单列表中。
通过公网访问:
Serverless资源组:请将Serverless资源组绑定VPC配置的EIP添加至数据源的白名单列表中。
在公网NAT网关控制台,找到配置好的SNAT条目,获取对应交换机绑定的公网IP地址。
旧版资源组:请添加资源组本身的EIP至数据源的白名单列表中。
在DataWorks控制台的资源组页面的独享资源组页签下,单击目标资源组后的查看信息,获取对话框中的EIP地址。
说明如果您之后对资源组进行了扩容操作,请检查此处待添加的EIP是否有变动,为了避免任务执行出错,请在扩容后第一时间更新数据源添加的白名单。
步骤三:测试连通性
如果资源组需要访问的数据源为DataWorks支持的数据源,您可以通过添加DataWorks数据源的方式来测试是否可以连通。
进入数据集成页面。
登录DataWorks控制台,切换至目标地域后,单击左侧导航栏的 ,在下拉框中选择对应工作空间后单击进入数据集成。
在左侧导航栏单击数据源,然后在数据源列表单击新增数据源,根据实际情况选择数据源并配置相关连接参数。
在底部资源组列表中,选择购买的资源组,单击测试连通性。
说明如果测试连通性结果为无法通过,可使用连通性诊断工具自助解决。
如果资源组需要访问的数据源为其他网络中部署的服务等,请根据实际情况,在业务代码中测试与数据源的连通性。
说明如果您的业务部署在阿里云ECS中,还需要配置安全组,允许资源组的交换机网段或VPC绑定的公网IP访问。
各场景网络连通配置示例
下文以使用阿里云RDS数据库和具备公网的自建数据库为例,介绍如何通过网络配置,实现DataWorks资源组与各环境下的数据源网络连通。
以下示例仅为资源组绑定普通安全组场景下的说明。
场景一:数据源与DataWorks工作空间同阿里云主账号、同地域
网络连通配置操作 | 配置操作图示 |
|
场景二:数据源与DataWorks工作空间同阿里云主账号、不同的地域
网络连通配置操作 | 配置操作图示 |
场景三:数据库与DataWorks工作空间使用不同阿里云主账号
网络连通配置操作 | 配置操作图示 |
场景四:数据源在IDC
数据源不在阿里云环境可参考该场景配置。
场景五:数据源在公网
该方案仅适用于Serverless资源组,旧版资源组已默认绑定EIP。
网络连通配置操作 | 配置操作图示 |
|
相关文档
资源组的更多介绍,请参见DataWorks资源组概述。
创建和使用资源组,请参见新增和使用Serverless资源组。
为资源组绑定VPC,请参见绑定专有网络。
为资源组绑定的专有网络VPC和交换机配置公网NAT网关。具体操作,请参见使用公网NAT网关SNAT功能访问互联网。