本文为您介绍同Region下不同的MaxCompute项目如何实现配置与数据的迁移。

前提条件

请您首先完成教程《搭建互联网在线运营分析平台》的全部步骤,详情请参见业务场景与开发流程

背景信息

本文使用的被迁移的原始项目为教程《搭建互联网在线运营分析平台》中的bigdata_DOC项目,您需要再创建一个迁移目标项目,用于存放原始项目的表、资源、配置及数据。

操作步骤

  1. 创建迁移目标项目
    本文中的MaxCompute项目即DataWorks的工作空间。
    1. 进入DataWorks工作空间列表,选择区域为华东1,单击创建工作空间


    2. 选择计算引擎服务为MaxCompute、按量付费。由于原始项目bigdata_DOC为简单模式,为方便起见,本文中DataWorks工作空间模式也为简单模式(单环境)。在简单模式下,DataWorks工作空间与MaxCompute项目一一对应,详情请参见简单模式和标准模式的区别


      说明 工作空间名称全局唯一,建议您使用易于区分的名称,本例中使用的名称为clone_test_doc
  2. 跨项目克隆
    您可以通过跨项目克隆功能将原始项目bigdata_DOC的节点配置和资源复制到当前项目,详情请参见跨项目克隆实践
    说明
    • 跨项目克隆无法复制表结构与数据。
    • 跨项目克隆无法复制组合节点,需要您手动创建。
    1. 在单原始的项目bigdata_DOC中击右上角的跨项目克隆,跳转至相应的克隆页面。


    2. 选择克隆目标工作空间clone_test_doc业务流程为您需要克隆的业务流程Workshop,勾选所有节点,单击添加到待克隆后单击右侧的待克隆列表


    3. 单击全部克隆,将选中节点克隆至工作空间clone_test_DOC


    4. 切换到您新建的项目,检查节点是否已完成克隆。


  3. 新建数据表
    跨项目克隆功能无法克隆您的表结构,因此您需要手动新建表。您可以参见新建数据表完成表的创建。

    说明 新建表后请将表提交到生产环境。
  4. 数据同步
    跨项目克隆功能无法复制原始项目的数据到新项目,因此您需要手动同步数据,本文中仅同步表rpt_user_trace_log的数据。
    1. 新建数据源。
      1. 数据集成页面单击同步资源管理 > 数据源,选择MaxCompute

      2. 填写您的数据源名称ODPS项目名称、AccessKey等信息,单击完成,详情请参见配置MaxCompute数据源

    2. 创建数据同步任务。
      1. 在您的数据开发页面右键您克隆的业务流程Workshop下的数据集成,单击新建数据集成节点 > 数据同步

      2. 编辑您新建的数据同步任务节点,填写参数如下图所示。其中数据源bigdata_DOC是您的原始项目,数据源odps_first代表您当前的新建项目,表名是您需要同步数据的表rpt_user_trace_log。完成后单击调度配置

      3. 单击使用工作空间根节点后,提交数据同步任务。

    3. 补数据
      1. 切换到运维中心后,单击周期任务。右键您的数据同步任务,单击补数据 > 当前节点

      2. 本例中,需要补数据的日期分区为2019年6月11日到17日,您可以直接选择业务日期,进行多个分区的数据同步。完成设置后,单击确定

      3. 任务运维 > 补数据实例页面,您可以查看您的补数据实例任务运行状态,待显示运行成功则说明完成数据同步。

    4. 结果验证
      您可以在业务流程 > 数据开发中新建ODPS SQL类型节点,通过运行select * from rpt_user_trace_log where dt BETWEEN '20190611' and '20190617';语句查看数据是否完成同步。