使用Hive连接器读取DLF数据表

修改Hive连接器的配置后,可以正常读取DLF(Data Lake Formation)的数据表。本文为您介绍如何使用Hive连接器读取DLF数据表。

前提条件

已在EMR on ACK控制台上创建Presto集群,详情请参见创建集群

操作步骤

  1. 进入catalog-hive.properties页签。

    1. 登录EMR on ACK控制台

    2. 在EMR on ACK页面,单击目标集群所在行的配置

    3. 单击catalog-hive.properties页签。

  2. 新增配置项。

    1. catalog-hive.properties页签,单击新增配置项

    2. 新增配置项对话框中,新增以下配置信息。

      参数

      描述

      hive.metastore

      固定值dlf。

      dlf.catalog.proxyMode

      固定值DLF_ONLY。

      dlf.catalog.akMode

      固定值EMR_AUTO。

      dlf.catalog.uid

      阿里云账号的账号ID。

      登录账号信息,请通过用户信息页面获取。获取登录账号

      dlf.catalog.endpoint

      DLF服务的Endpoint。详情请参见已开通的地域和访问域名

      推荐您设置为DLF的VPC Endpoint。例如,如果您选择的地域为cn-hangzhou地域,则参数值需要配置为dlf-vpc.cn-hangzhou.aliyuncs.com。

      说明

      您也可以使用DLF的公网Endpoint,如果您选择的地域为cn-hangzhou地域,则参数值需要配置为dlf.cn-hangzhou.aliyuncs.com。

      dlf.catalog.region

      DLF服务的地域名。例如,cn-hangzhou。

    3. 单击确定

    4. 在弹出的对话框中,输入执行原因,单击确定

  3. 重启Presto服务。

    1. 单击上方的服务详情页签。

    2. 组件列表区域,单击TrinoCoordinatorTrinoWorker操作列的重启

      Restart

    3. 在弹出的对话框中,输入执行原因,单击确定

    4. 确认对话框中,单击确定

      服务重启完成后,即可正常读取DLF数据表。