文档

Presto以EMR集群的方式查询OSS-HDFS服务中的数据

更新时间:

本文介绍Presto如何以EMR集群的方式查询OSS-HDFS服务中的数据。

前提条件

操作步骤

  1. 登录EMR集群。

    1. 登录EMR on ECS控制台

    2. 单击创建的EMR集群。

    3. 单击节点管理页签,然后单击节点组左侧的+

    4. 单击ECS ID。在ECS实例页面,单击实例ID右侧的远程连接

    如果您希望使用SSH方式(SSH密钥对或SSH密码)在Windows和Linux环境中登录集群,请参见登录集群

  2. 查询OSS-HDFS服务中的数据。
    以下以常用的Hive catalog为例,使用Presto创建一个OSS中的schema,并执行简单的SQL查询示例。由于Presto依赖Hive Metastore,因此Hive服务也需要安装并部署JindoSDK。具体操作,请参见Hive使用JindoSDK处理OSS-HDFS服务中的数据
    1. 登录Presto控制台。
      presto --server <presto_server_address>:<presto_server_port> --catalog hive
    2. 创建OSS中的schema。
      create schema testDB with (location='oss://<Bucket>.<Endpoint>/<schema_dir>');
    3. 使用schema。
      use testDB;
    4. 创建表。
      create table tbl (key int, val int);
    5. 往表中插入数据。
      insert into tbl values (1,666);
    6. 查询表。
      select * from tbl;

  • 本页导读 (1)
文档反馈