本节介绍Presto中的基本概念,以便更好的理解Presto的工作机制。

数据模型

数据模型即数据的组织形式。Presto使用Catalog、Schema和Table三层结构来管理数据。
  • Catalog

    一个Catalog可以包含多个Schema,物理上指向一个外部数据源,可以通过Connector访问该数据源。一次查询可以访问一个或多个Catalog。

  • Schema

    相当于一个数据库实例,一个Schema包含多张数据表。

  • Table

    数据表,与一般意义上的数据库表相同。

Catalog、Schema和Table之间的关系如下图所示。Catalog,Schema ,Table 关系图

Connector

Presto通过各种Connector来接入多种外部数据源。Presto提供了一套标准的SPI接口,用户可以使用这套接口开发自己的Connector,以便访问自定义的数据源。

一个 Catalog一般会绑定一种类型的Connector(在Catalog的Properties文件中设置)。Presto内置了多种Connector。