MySQL数据源为您提供读取和写入MySQL双向通道的功能,方便您后续可以通过向导模式和脚本模式配置数据同步任务。本文为您介绍,配置数据源之前需要准备的网络环境及账号权限,以及在DataWorks中如何新增MySQL数据源。

前提条件

配置数据源之前,请确保已完成以下规划与准备工作。
  • 准备数据源:已购买来源数据源MySQL。
  • 已配置同步账号权限,详情请参见配置账号权限

    实时同步通过数据源配置账号访问MySQL,在实时同步场景下,您需要确保此账号拥有数据库的SELECTREPLICATION SLAVEREPLICATION CLIENT权限。

  • 已开启MySQL Binglog服务,详情请参见开启MySQL Binlog

    数据集成通过实时订阅MySQL Binlog实现增量数据实时同步,您需要在DataWorks配置同步任务前,先开启MySQL Binlog服务。

  • 已购买合适规格的独享数据集成资源组。详情请参见新增和使用独享数据集成资源组
  • 已配置数据同步资源组与数据库的网络连通,详情请参见配置资源组与网络连通

背景信息

标准模式的工作空间支持数据源隔离功能,您可以分别添加并隔离开发环境和生产环境的数据源,以保护您的数据安全。详情请参见数据源开发和生产环境隔离

如果您使用MySQL 8.0,需要使用独享数据集成资源组,资源组详情请参见新增和使用独享数据集成资源组

使用限制

  • DataWorks的数据集成实时同步MySQL数据是基于实时订阅MySQL实现的,实时同步MySQL数据目前仅支持配置MySQL数据源为RDS的5.x8.x版本的MySQL,不支持配置为DRDS的MySQL。
  • 不支持XA ROLLBACK,针对已经XA PREPARE的事务数据,实时同步会将其同步到目标端,如果XA ROLLBACK,实时同步不会针对XA PREPARE的数据做回滚写入的操作。若要处理XA ROLLBACK场景,需要手动将XA ROLLBACK的表从实时同步任务中移除,再添加表后重新进行全量数据初始化以及增量实时同步。
  • 在添加MySQL数据源时,若添加了其他阿里云账号下的MySQL实例,后续同步任务配置该数据源时,仅支持使用独享数据集成资源组运行该同步任务,公共资源组无法访问该数据源中的数据。

新增MySQL数据源

  1. 进入数据源管理页面。
    1. 登录DataWorks控制台
    2. 在左侧导航栏,单击工作空间列表
    3. 选择工作空间所在地域后,单击相应工作空间后的进入数据集成
    4. 在左侧导航栏,单击数据源,进入数据源管理页面。
  2. 数据源管理页面,单击右上角的新增数据源
  3. 新增数据源对话框中,选择数据源类型为MySQL
  4. 新增MySQL数据源对话框中,配置各项参数。
    1. 配置数据源的基本信息。
      MySQL数据源包括阿里云实例模式连接串模式两种类型。
      • 以新增阿里云实例模式类型的数据源为例,配置数据源的基本信息。实例模式
        参数 描述
        数据源类型 当前选择的数据源类型为阿里云实例模式
        数据源名称 数据源名称必须以字母、数字、下划线(_)组合,且不能以数字和下划线(_)开头。
        数据源描述 对数据源进行简单描述,不得超过80个字符。
        适用环境 可以选择开发生产环境。
        说明 仅标准模式工作空间会显示该配置。
        地区 选择相应的地域。
        RDS实例ID 您可以进入RDS控制台,查看RDS实例ID。
        RDS实例主账号ID 实例购买者登录DataWorks控制台,鼠标悬停至右上角的用户头像,查看账号ID。
        默认数据库名
        此处配置的是该数据源对应的默认数据库名称。后续配置同步任务的说明如下:
        • 配置整库同步(包含实时和离线)或同步解决方案任务时,您可以选择相应RDS实例下所有具有权限的数据库。
        • 配置离线同步任务,当您选择使用多个数据库时,则每个数据库均需要配置一个数据源。
        用户名 登录数据库的用户名称。
        密码 登录数据库的密码。密码中避免使用@符号。
        备库设置 如果数据源具备只读实例(备库),可以在配置任务时开启备库设置,并选择备库ID。设置备库的优势是防止干扰主库,不影响主库性能。如果有多个只读实例,则会任选一个可用的来读取。
        说明 此功能仅支持独享资源组。
        说明 您需要先添加RDS白名单才可以与RDS数据库连接成功,详情请参见添加白名单
      • 以新增连接串模式类型的数据源为例,配置数据源的基本信息。JDBC
        参数 描述
        数据源类型 当前选择的数据源类型为连接串模式
        数据源名称 数据源名称必须以字母、数字、下划线(_)组合,且不能以数字和下划线(_)开头。
        数据源描述 对数据源进行简单描述,不得超过80个字符。
        适用环境 可以选择开发生产环境。
        说明 仅标准模式工作空间会显示该配置。
        JDBC URL JDBC连接信息,格式为jdbc:mysql://ServerIP:Port/Database。您可以进入RDS控制台,单击目标实例ID,在基本信息区域单击查看链接详情,获取对应的连接信息。此连接串中的Database为本数据源的默认数据库,后续在配置同步任务时,您可以使用相应RDS实例下,所有当前用户有登录权限的数据库。
        说明 离线同步任务使用该数据源时默认访问本数据源的指定数据库。同步解决方案使用该数据源时可以读取对应实例下的所有数据库。
        用户名 登录数据库的用户名。
        密码 登录数据库的密码。
  5. 选择资源组连通性类型为数据集成
  6. 在资源组列表,单击相应资源组后的测试连通性
    数据同步时,一个任务只能使用一种资源组。您需要测试每个资源组的连通性,以保证同步任务使用的数据集成资源组能够与数据源连通,否则将无法正常执行数据同步任务。如果您需要同时测试多种资源组,请选中相应资源组后,单击批量测试连通性。详情请参见配置资源组与网络连通
    说明
    • (推荐)资源组列表默认仅显示独享数据集成资源组,为确保数据同步的稳定性和性能要求,推荐使用独享数据集成资源组。
    • 如果您需要测试公共资源组或自定义资源组的连通性,请在资源组列表右下方,单击更多选项,在警告对话框单击确定,资源组列表会显示可供选择的公共资源组和自定义资源组。
  7. 测试连通性通过后,单击完成

后续步骤

现在,您已经学习了如何配置MySQL数据源,您可以继续下一个教程。在该教程中,您将学习如何配置MySQL插件。详情请参见MySQL ReaderMySQL Writer