本文将介绍云原生数据仓库AnalyticDB PostgreSQL版的典型场景及产品功能优势。
典型场景
- 数据仓库服务
您可以通过数据传输服务(DTS)或数据集成服务(DataX),将云数据库(例如RDS、PolarDB)或自建数据库批量同步到云原生数据仓库AnalyticDB PostgreSQL版。云原生数据仓库PostgreSQL版支持对海量数据的复杂ETL进行处理,这些操作任务也可以被DataWorks调度。同时它还支持高性能的在线分析能力,可以通过Quick BI、DataV、Tableau、帆软等即时查询数据,并将数据以报表形式展现。
- 大数据分析平台
对于MaxCompute、Hadoop和Spark中保存的海量数据,可通过采用数据集成服务(DataX)或通过对象存储服务(OSS),快速批量导入到云原生数据仓库AnalyticDB PostgreSQL版,帮助您实现高性能分析处理和在线数据探索。
- 数据湖分析
云原生数据仓库AnalyticDB PostgreSQL版可以通过外部表机制,高并行直接访问海量云存储OSS上的数据,构筑阿里云统一数据湖分析平台。
产品功能优势
针对主要的OLAP业务,云原生数据仓库AnalyticDB PostgreSQL版具备以下优势。
- ETL离线数据处理
面对复杂SQL优化和海量数据大规模聚合分析等挑战,云原生数据仓库AnalyticDB PostgreSQL版具有如下技术优势:
- 支持标准SQL、OLAP窗口函数和存储过程。
- ORCA分布式SQL优化器,复杂查询免调优。
- MPP多节点全并行计算,PB级数据秒级响应。
- 基于列存储的高性能大表扫描,极高压缩比。
- 在线高性能查询
面对任意维度数据即时探索和数据实时入库更新等挑战,云原生数据仓库AnalyticDB PostgreSQL版具有如下技术优势:
- 高吞吐数据写入及更新(如INSERT、UPDATE、DELETE)。
- 行存储及多种索引(如B-tree、Bitmap),点查询毫秒级返回。
- 支持分布式事务,标准数据库隔离级别,支持HTAP混合负载。
- 多模数据分析
面对多种非结构化数据源的挑战,云原生数据仓库AnalyticDB PostgreSQL版具有如下技术优势:
- 支持PostGIS插件扩展,实现地理数据分析处理。
- 通过MADlib插件扩展,内置多种机器学习算法,实现AI Native DB。
- 支持通过向量检索,实现非结构化数据(如图片、语音、文本)的高性能检索分析。
- 支持JSON等格式,支持日志等半结构化数据处理分析。