什么是AnalyticDB
AnalyticDB是阿里云自研的云原生实时数据仓库,支持从OLTP数据库和日志文件中实时写入数据,并秒级完成PB级数据分析。AnalyticDB采用云原生存算分离的架构,存储按量付费,计算弹性伸缩,同时具备离线处理与在线分析资源隔离的能力,满足企业对于数据处理效率、成本控制、系统稳定性的要求。兼容MySQL、PostgreSQL和Spark生态。
AnalyticDB共有两个引擎,分别为AnalyticDB for MySQL和AnalyticDB for PostgreSQL。
对比项 | AnalyticDB for MySQL | AnalyticDB for PostgreSQL | |
生态 | 高度兼容MySQL 高度兼容Spark | 100%兼容PostgreSQL 高度兼容Oracle | |
架构 | 计算存储分离架构 | ||
扩展性 | 共同点 | 垂直变配 水平扩展 | |
差异 | 支持Multi-Cluster模型实现资源自动弹性 支持MIN-MAX模型实现资源分时弹性和自动弹性 | 支持定时任务实现定时的自动弹性变配 支持Serverless形态实现按需自动弹性变配 | |
重点功能 | 共同点 | 向量检索 全文检索 离线批处理 实时物化视图 | |
差异 | 数据湖 Spark离线处理 查询性能的智能诊断与调优 | RAG应用 时空分析 | |
应用场景 | 共同点 | 实时数仓 实时日志分析 商业智能报表 | |
差异 | 精准营销 多源联合分析 大数据存储分析 离线数据加速 其它数据湖或数据仓库业务迁移(Databricks/Athena/自建Spark/Presto等) | 一站式搭建大模型应用 企业专属知识库 GIS 时空大数据分析 离在线一体数据分析 其他云数据仓库业务迁移(Greenplum、Redshift、Synapse、Snowflake、BigQuery等) | |
客户行业 | 游戏、零售、汽车 | 零售、电商、教育 | |
节省成本 | 共同点 | 按实际数据量收取数据存储费用 冷热数据分离存储,降低数据存储的成本 根据规律的业务波峰波谷,自动定时弹性扩缩资源,既保障流量高峰的资源充足,又避免高峰过后的资源闲置浪费 | |
差异 | 根据业务的实际负载,自动弹性扩缩资源 | 根据实际业务需要,手动启动或暂停实例 |
AnalyticDB for MySQL简介
云原生数据仓库 AnalyticDB MySQL 版产品系列经过五年的演进,先后推出了数仓版预留模式、数仓版弹性模式、湖仓版、以及企业版和基础版。产品系列演进图如下。
最早的数仓版预留模式为存算一体架构,可以满足高性能查询的需求,但无法单独增加计算资源或存储资源。
为了在业务流量高峰增加计算资源保证查询性能,在业务流量低谷减少计算资源节省资源成本,AnalyticDB for MySQL推出了存算分离架构的数仓版弹性模式。不仅解决了计算资源弹性扩缩容的问题,还支持按资源组将计算资源物理隔离用于满足多租户混合负载的场景。
近年来,针对半结构化和非结构化数据分析(例如日志数据)的业务诉求越来越多,因此,AnalyticDB for MySQL推出了基于弹性模式的湖仓版,提供Spark计算引擎满足大数据离线处理需求。
新推出的企业版和基础版,融合了数仓版预留模式、数仓版弹性模式和湖仓版的优点。预留资源采用存算一体架构,保证常规业务的查询性能。如果业务负载有周期性变化或突变的情况,可以弹性增加或减少计算资源。
更多关于云原生数据仓库 AnalyticDB MySQL 版产品系列的介绍,请参见产品系列。
AnalyticDB for PostgreSQL简介
AnalyticDB for PostgreSQL分为存储弹性模式和Serverless两种产品形态。存储弹性模式是基于ECS+ESSD云盘的Shared-Nothing架构采用MPP架构,Serverless是基于ECS+本地缓存+OSS远端存储的存储计算分离的Shared-Storage架构。
AnalyticDB for PostgreSQL实例包含一个协调节点(又称Master节点)和多个工作节点(又称Segment节点)。协调节点负责集群的元数据管理、负载均衡等。工作节点负责数据处理,工作节点内部包含Orca优化器、自研的Laser执行引擎和Beam存储引擎,实现查询的高性能,同时结合IMV实时物化视图组件,打造实时数仓。工作节点挂载的ESSD云盘负责热数据存储,而冷数据则存储在OSS中,通过冷热数据分层存储,兼顾查询性能和存储成本。工作节点的计算资源和存储资源,可独立扩缩容。