一键同步MaxCompute数据

本文为您介绍如何使用HoloStudio导入MaxCompute数据至Hologres。

说明

HoloStudio已下线,详情请参见DataWorks HoloStudio下线公告

前提条件

背景信息

HoloStudio支持一键MaxCompute数据同步功能,您可以使用可视化方式导入MaxCompute表数据并进行查询。该方式比创建外部表直接查询数据的性能更好。

您也可以使用SQL语句导入MaxCompute数据,详情请参见使用SQL导入MaxCompute的数据至Hologres

操作步骤

  1. 登录阿里云官网

  2. 新建一键MaxCompute数据同步节点。

    1. 进入Hologres管理控制台

    2. 在页面上方选择目标地域。

    1. 在左侧菜单栏单击前往DataStudio,前往DataWorks-HoloStudio开发。

    2. Holo Studio页面的左侧导航栏,单击数据开发图标。

    3. 进入数据开发页面,鼠标悬停至顶部菜单栏的新建图标。

    4. 单击一键MaxCompute数据同步

    5. 新建节点对话框中,输入节点名称,并选择目标文件夹数据库

    6. 单击提交

  3. 在编辑节点页面,配置各项参数。配置参数

    参数

    描述

    外部表来源

    • 已有外部表:表示在Hologres中已经建立MaxCompute数据映射的外部表。

    • 新建外部表:表示外部表在Hologres中未建立MaxCompute数据映射。如果您需要导入MaxCompute表数据,请选中新建外部表

    外部表表名字

    已创建的外部表表名称。

    Hologres中创建的外部表用于映射MaxCompute数据,需要与导入数据的MaxCompute表结构一一对应。

    目标库

    Hologres的数据库名称。

    目标Schema

    当前数据库的Schema名称。

    如果您没有新建Schema,则只能选择默认创建的public。如果有新建的Schema,您也可以选择新建的Schema。

    目标表名

    需要导入数据的表名称。

    目标表描述

    目标表的信息描述。

    同步字段

    需要导入的MaxCompute表字段。

    您可以选择导入部分或全部字段。

    分区配置

    需要导入的分区字段。

    一键MaxCompute数据同步功能仅支持导入一级分区。如果您需要导入多级分区,请在SQL Console中使用SQL语句实现,详情请参见SQL Console

    索引配置

    您可以为目标表创建索引,详情请参见建表概述

    SQL Script

    自动解析当前可视化操作对应的SQL语句。

  4. 在新建节点的编辑页面,单击保存图标,保存配置信息。

  5. 在新建节点的编辑页面,单击运行图标,导入MaxCompute表数据。

  6. PG管理页面,查看导入的外部表数据,详情请参见创建及管理外部表SQL Console