本文将介绍云原生数据仓库PostgreSQL版的典型场景及产品功能优势。

典型场景

1
  • 数据仓库服务

    您可以通过数据传输服务(DTS)或数据集成服务(DataX),将云数据库(例如RDS、PolarDB)或自建数据库批量同步到云原生数据仓库PostgreSQL版。云原生数据仓库PostgreSQL版支持对海量数据的复杂ETL进行处理,这些操作任务也可以被Dataworks调度。同时它还支持高性能的在线分析能力,可以通过QuickBI、DataV、Tableau、帆软等即时查询数据,并将数据以报表形式展现。

  • 大数据分析平台

    对于MaxCompute、Hadoop和Spark中保存的海量数据,可通采用数据集成服务(DataX)或通过对象存储服务(OSS),快速批量导入到云原生数据仓库PostgreSQL版,帮助您实现高性能分析处理和在线数据探索。

  • 数据湖分析

    云原生数据仓库PostgreSQL版可以通过外部表机制,高并行直接访问海量云存储OSS上的数据,构筑阿里云统一数据湖分析平台。

产品功能优势

针对主要的OLAP业务,云原生数据仓库PostgreSQL版具备以下优势。

  • ETL离线数据处理

    面对复杂SQL优化和海量数据大规模聚合分析等挑战,云原生数据仓库PostgreSQL版具有如下技术优势:

    • 支持标准SQL、OLAP窗口函数和存储过程。
    • ORCA分布式SQL优化器,复杂查询免调优。
    • MPP多节点全并行计算,PB级数据秒级响应。
    • 基于列存储的高性能大表扫描,极高压缩比。
  • 在线高性能查询

    面对任意维度数据即时探索和数据实时入库更新等挑战,云原生数据仓库PostgreSQL版具有如下技术优势:

    • 高吞吐数据写入及更新(如INSERT、UPDATE、DELETE)。
    • 行存储及多种索引(如Btree、Bitmap),点查询毫秒级返回。
    • 支持分布式事务,标准数据库隔离级别,支持HTAP混合负载。
  • 多模数据分析

    面对多种非结构化数据源的挑战,云原生数据仓库PostgreSQL版具有如下技术优势:

    • 支持PostGIS插件扩展,实现地理数据分析处理。
    • 通过MADlib插件扩展,内置多种机器学习算法,实现AI Native DB。
    • 支持通过向量检索,实现非结构化数据(如图片、语音、文本)的高性能检索分析。
    • 支持JSON等格式,支持日志等半结构化数据处理分析。