本文为您介绍如何使用HoloStudio导入MaxCompute数据至Hologres。

前提条件

背景信息

HoloStudio支持一键MaxCompute数据同步功能,您可以使用可视化方式导入MaxCompute表数据并进行查询。该方式比创建外部表直接查询数据的性能更好。

您也可以使用SQL语句导入MaxCompute数据,详情请参见使用SQL导入MaxCompute的数据至Hologres

操作步骤

  1. 登录阿里云官网
  2. 新建一键MaxCompute数据同步节点。
    1. 进入Hologres管理控制台
    2. 鼠标悬停至顶部菜单栏左侧的三角图标,选择目标地域。
    3. 实例列表 > Hologres引擎管理页面,单击前往DataWorks-HoloStudio开发
    4. Holo Studio页面的左侧导航栏,单击数据开发图标。
    5. 进入数据开发页面,鼠标悬停至顶部菜单栏的新建图标。
    6. 单击一键MaxCompute数据同步
    7. 新建节点对话框中,输入节点名称,并选择目标文件夹数据库
    8. 单击提交
  3. 在编辑节点页面,配置各项参数。配置参数
    参数 描述
    外部表来源
    • 已有外部表:表示在Hologres中已经建立MaxCompute数据映射的外部表。
    • 新建外部表:表示外部表在Hologres中未建立MaxCompute数据映射。如果您需要导入MaxCompute表数据,请选中新建外部表
    外部表表名字 已创建的外部表表名称。

    Hologres中创建的外部表用于映射MaxCompute数据,需要与导入数据的MaxCompute表结构一一对应。

    目标库 Hologres的数据库名称。
    目标Schema 当前数据库的Schema名称。

    如果您没有新建Schema,则只能选择默认创建的public。如果有新建的Schema,您也可以选择新建的Schema。

    目标表名 需要导入数据的表名称。
    目标表描述 目标表的信息描述。
    同步字段 需要导入的MaxCompute表字段。

    您可以选择导入部分或全部字段。

    分区配置 需要导入的分区字段。

    一键MaxCompute数据同步功能仅支持导入一级分区。如果您需要导入多级分区,请在SQL Console中使用SQL语句实现,详情请参见SQL Console

    索引配置 您可以为目标表创建索引,详情请参见设置表属性
    SQL Script 自动解析当前可视化操作对应的SQL语句。
  4. 在新建节点的编辑页面,单击保存图标,保存配置信息。
  5. 在新建节点的编辑页面,单击运行图标,导入MaxCompute表数据。
  6. PG管理页面,查看导入的外部表数据,详情请参见外部表SQL Console