您可以通过配置同步解决方案,一次性实时同步指定数据源中的数据至Hologres。

操作步骤

  1. 进入同步解决方案页面。
    1. 登录DataWorks控制台
    2. 在左侧导航栏,单击工作空间列表
    3. 选择工作空间所在地域后,单击相应工作空间后的进入数据集成
    4. 在左侧导航栏,单击同步解决方案
  2. 同步解决方案页面,单击右上方的新建任务
  3. 新建解决任务对话框中,单击一键实时同步至Hologres
  4. 设置同步来源和规则页面,配置各项参数。
    1. 基本配置区域,配置各项参数。
      基本配置
      参数 描述
      方案名称 同步解决方案的名称,最多支持50个字符。
      描述 对当前方案进行简单描述,最多支持50个字符。
      目标任务存放位置 默认创建一个新的业务流程,所有任务均以clone_database_源端数据源名称+to+目标数据源名称的命名方式存放至数据集成目录下。

      您也可以取消自动建立工作流程,在选择位置下拉列表中指定存放目标任务的路径。

    2. 数据来源区域,选择类型数据源
      说明 仅支持选择MySQL和SQL Server类型的数据源。
    3. 选择同步的源表区域,选中需要同步的源表,单击>,将其移动至已选源表
      源表
      该区域会为您展示所选数据源下所有的表,您可以选择整库全表或部分表进行同步。
      注意 如果选中的表没有主键,将无法进行实时同步。
    4. 设置同步规则区域,单击添加规则,选择相应的规则进行添加。
      同步规则包括表名转换规则目标表名规则
      • 表名转换规则:转换表名为目标表名,进行字符串替换。
      • 目标表名规则:支持对转换后的表名添加前缀和后缀。
    5. 单击下一步
  5. 设置目标表页面,配置各项参数。
    1. 选择目标Hologres数据源和该数据源下的Schema,并设置是否开启表名大小写敏感
    2. 单击刷新源表和Hologres表映射,创建需要同步的源表和目标Hologres表的映射关系。
    3. 查看任务的执行进度和表来源。
      进度
      序号 描述
      显示映射关系的创建进度。
      说明 如果同步的表数量较多,会导致执行进度较慢,请耐心等待。
      暂不支持同步没有主键的表。但只要选择的表中包括有主键的表,会正常执行流程,没有主键的表会被忽略。
      包括自动建表使用已有表
      选择的表建立方式不同,此处显示的Hologres表名也不同:
      • 表建立方式选择自动建表时,显示自动创建的Hologres表名称。您可以单击表名称,查看和修改建表语句。
      • 表建立方式选择使用已有表时,请在下拉列表中选择需要的表。
    4. 单击下一步
  6. 运行资源设置页面,配置各项参数。
    运行资源设置
    参数 描述
    选择实时任务独享资源组 分别选择实时任务和全量离线任务需要使用的独享资源组。目前解决方案仅支持使用独享数据集成资源组,详情请参见独享数据集成资源组
    选择全量离线任务独享资源组
    选择调度资源组 选择运行任务时使用的调度资源组。
    来源端读取支持最大连接数 读取端的最大连接数,即来源端数据库的JDBC连接数。请根据数据库资源的实际情况合理配置。
    离线任务名称规则 全量同步时的离线任务名称。创建解决方案后,会先生成一个离线任务用于读取全量数据,再生成实时任务持续读取实时增量数据。
  7. 单击完成配置
  8. 解决方案任务列表页面,单击相应任务后的开始执行,运行创建的解决方案。
    运行任务成功后,您可以进行以下操作:
    • 单击相应任务后的任务配置,查看或编辑任务。
      说明 仅单击未运行状态后的任务配置,您可以编辑任务。其它状态下的任务配置页面,仅支持查看。
    • 单击已运行任务后的执行详情,查看当前解决方案的起始时间结束时间状态等详情。状态
    • 单击相应任务后的删除。在删除对话框中,单击确定
      说明 仅删除当前任务的配置记录,已经生成的表和任务不受影响。