产品核心技术架构与多版本解析-云原生数据仓库AnalyticDB-阿里云

云原生数据仓库 AnalyticDB MySQL 版是阿里巴巴自主研发、经过超大规模以及核心业务验证的PB级实时数据仓库。

概述

自2012年第一次在集团发布上线以来，AnalyticDB for MySQL至今已累计迭代发布近百个版本，支撑起集团内的电商、广告、物流、文娱、旅游、风控等众多在线分析业务。AnalyticDB for MySQL从2014年开始正式对外提供服务，覆盖十多个行业，既包括传统的大中型企业和政府机构，也包括众多的互联网公司。

AnalyticDB for MySQL是基于数据库大数据一体化的理念和趋势，在工程上深度打磨出的云原生数据仓库。

技术架构

AnalyticDB for MySQL采用云原生架构，计算存储分离、冷热数据分离，支持高吞吐实时写入和数据强一致，兼顾高并发查询和大吞吐批处理的混合负载。

AnalyticDB for MySQL融合了分布式、弹性计算与云计算的优势，对规模性、易用性、可靠性和安全性等方面进行了大规模的改进，充分满足不同场景实时数据仓库的需求。支持更大规模的并发访问、更快读写能力以及更智能的混合查询负载管理等，实现更精细化的资源利用和更低成本的投入，让您能更加专注于业务发展，专注于数据价值。

在硬件部署层面，AnalyticDB for MySQL支持Intel/AMD芯片，支持x86指令集。

企业版和基础版

企业版实现了服务秒级恢复，支持跨可用区部署，自动故障检测、摘除和副本重搭。配合三副本存储、全量和增量备份，提供金融级别的数据可靠性。在周边生态上，提供数据迁移、数据同步、数据管理、数据集成、数据安全等配套工具，方便使用的同时，让您能更加专注于业务发展。

基础版为单副本形态，功能特性与企业版相同。但底层为单副本存储，不提供高可用服务，适用于对数据高可用无需求、追求低成本热数据存储的业务场景。

企业版和基础版架构如下：

访问层

访问层由Multi-Master可线性扩展的协调节点构成，主要负责协议层接入、SQL解析和优化、实时写入Sharding、数据调度和查询调度。

访问层通过统一计费单位、统一元数据和权限、统一开发语言、统一传输链路，提升开发效率。

计算层

自研计算引擎同时提供MPP和BSP两种模式。MPP模式是一种流式计算模式，不适合离线处理低成本和高吞吐场景。BSP模式，通过DAG进行任务切分，分批调度，满足有限资源下大数据量计算，支持计算数据落盘。计算引擎提供自动切换能力，即当查询使用MPP模式无法在一定耗时内完成时，系统会自动切换为BSP模式进行执行。

同时，提供开源Spark计算引擎，可以满足更复杂的离线处理场景和机器学习场景。Spark计算层和存储层互相打通，您可以使用计算层资源来处理存储层数据。在创建和配置Spark资源组时，操作更加方便。通过GPU和FPGA的硬件加速，我们能够实现更高的性价比。

自研存储引擎是基于共享存储实现的分布式、实时、强一致和高可用的引擎。数据通过分片和Multi-Raft技术实现并行实时写入，利用分层存储策略进行冷热数据分离，有效降低成本。同时，结合行列存储和智能索引技术，能够实现卓越的性能表现。

存储层

只需一份全量数据，满足离线和在线场景。

在线分析场景需要数据尽量在高性能存储介质上提高性能，离线场景需要数据尽量在低成本存储介质上降低存储成本。为满足不同场景需求，首先将一份全量数据存储在低成本高吞吐存储介质中，低成本离线处理场景直接读写低成本存储介质中的数据，可降低数据存储和数据IO成本，保证高吞吐。其次将实时数据存储在ESSD云盘上，保证行级的数据实时性，同时对全量数据构建索引，并通过缓存能力对数据进行加速，满足百毫秒级高性能在线分析场景。

内置的数仓存储对外开放，不锁定用户数据，提供统一Storage API存储接口层及Arrow数据访问格式。支持使用开源计算引擎（如Spark和Presto）访问内部的数据，同时对湖的生态（Iceberg、Hudi、DeltaLake、Paimon等）提供了完备的支持。

历史形态

数仓版

数仓版主要用来处理高性能在线分析场景的数据。

数仓版架构如下：

接入层

接入层由Multi-Master可线性扩展的协调节点构成，主要负责协议层接入、SQL解析和优化、实时写入Sharding、数据调度和查询调度。

计算引擎

计算引擎具备分布式MPP和DAG融合执行能力，结合智能优化器，可支持高并发和复杂SQL混合负载。同时借助云原生基础设施，计算节点实现了弹性调度，可根据业务需求做到分钟级甚至秒级扩展，实现了资源的有效利用。

存储引擎

存储引擎是基于Raft协议实现的分布式实时强一致高可用的引擎，通过数据分片和Multi-Raft实现并行，利用分层存储实现冷热分离降低成本，通过行列存储和智能索引达到很好的性能。

在这三层架构之上，通过服务秒级恢复，支持跨可用区部署，自动故障检测、摘除和副本重搭。配合三副本存储、全量和增量备份，提供金融级别的数据可靠性。在周边生态上，提供数据迁移、数据同步、数据管理、数据集成、数据安全等配套工具，方便使用，使您能更加专注于业务发展。

湖仓版

在数仓版基础上，同时满足低成本离线处理和高性能在线分析的湖仓一体化版本，称为湖仓版。湖仓版在数据全链路的“采存算管用”5大方面都进行了全面升级。

湖仓版架构如下：

数据源

数据管道APS可以一键低成本接入数据库、日志、大数据中的数据。

访问层

访问层通过统一计费单位、统一元数据和权限、统一开发语言、统一传输链路，提升开发效率。

存储层+计算层

支持自研引擎，羲和计算引擎和玄武存储引擎。支持集成的开源引擎，Spark计算引擎和Hudi存储引擎。可以借助开源的能力为您提供更丰富的数据分析场景。同时打通自研和开源引擎之间的互相访问，提供更一体化的体验。

存储层：只需一份全量数据，满足离线和在线场景。
在线分析场景需要数据尽量在高性能存储介质上提高性能，离线场景需要数据尽量在低成本存储介质上降低存储成本。为满足不同场景需求，首先将一份全量数据存储在低成本高吞吐存储介质中，低成本离线处理场景直接读写低成本存储介质中的数据，可降低数据存储和数据IO成本，保证高吞吐。其次将实时数据存储在单独的存储IO节点（EIU）上，保证行级的数据实时性，同时对全量数据构建索引，并通过缓存能力对数据进行加速，满足百毫秒级高性能在线分析场景。
计算层：羲和计算引擎，智能选择计算模式。开源Spark计算引擎，满足多种场景。
羲和计算引擎与Spark计算引擎共同构成了AnalyticDB for MySQL计算层的基石，两者相辅相成，既保证了在线分析的高性能需求，又覆盖了广泛的离线处理和高级分析场景，提供一站式的云端数据仓库解决方案。
羲和计算引擎同时提供MPP和BSP两种模式。MPP模式是一种流式计算模式，不适合离线处理低成本和高吞吐场景。BSP模式，通过DAG进行任务切分，分批调度，满足有限资源下大数据量计算，支持计算数据落盘。羲和计算引擎提供自动切换能力，即当查询使用MPP模式无法在一定耗时内完成时，系统会自动切换为BSP模式进行执行。
湖仓版新增的开源Spark计算引擎可以满足更复杂的离线处理场景和机器学习场景。湖仓版中Spark计算层和存储层互相打通，您可以使用计算层资源来处理存储层数据，在创建和配置Spark资源组时更容易。