文档

Hive数据源

更新时间:

通过Hive Catalog,您可以直接查询Hive中的数据。本文为您介绍如何创建和查看Hive Catalog。

创建Hive Catalog

语法

CREATE EXTERNAL CATALOG <catalog_name>
PROPERTIES
( 
  "key"="value", 
  ...
);

参数说明

  • catalog_name:Hive Catalog的名称,必选参数。命名要求如下:

    • 必须由字母(a~z或A~Z)、数字(0~9)或下划线(_)组成,并且只能以字母开头。

    • 总长度不能超过64个字符。

  • PROPERTIES:Hive Catalog的属性,必选参数。Hive使用的元数据服务不同,该参数的配置也不同。不同元数据服务的配置方法如下:

    属性

    是否必选

    说明

    type

    数据源类型,取值为hive

    hive.metastore.uris

    Hive MetaStore的URI。格式为thrift://<Hive metastore的IP地址>:<端口号>,端口号默认为9083。

    hive.metastore.type

    配置MetaStore类型,默认为空,表示使用Hive MetaStore的元数据。当需要使用DLF的元数据时,请设置参数值为dlf

    dlf.catalog.id

    DLF数据目录ID。仅当hive.metastore.type配置为dlf时需要填写该参数。如果未配置dlf.catalog.id参数的值,则系统将使用默认的DLF Catalog。

示例

以下示例创建了一个名为hive_catalog的Hive Catalog。

CREATE EXTERNAL CATALOG hive_catalog
PROPERTIES
(
    "type" = "hive",
    "hudi.catalog.uris" = "thrift://xx.xx.xx.xx:9083"
);

查看Hive表数据

您可以通过SELECT查询目标数据库中的目标表。

SELECT * FROM <catalog_name>.<database_name>.<table_name>;

相关文档

Hive更多介绍,请参见Hive概述

  • 本页导读 (1)
文档反馈