极致性能是AnalyticDB MySQL版的核心竞争力之一。自2019年4月开始至今,AnalyticDB MySQL版在世界权威机构测评的TPC-DS榜单中位居第一名,性价比是第二名的4倍,并且运行速度每年仍在提高。这都归功于自研羲和分析计算引擎技术的不断迭代和持续领先。
异步执行引擎
羲和采用纯异步的执行驱动方式。相对于同步执行,尽管增加了查询执行实现的复杂度,但是通过用户态的并行管理能力,提高了系统CPU的并行执行的效率。这是羲和分析计算引擎极致性能的基础能力。
向量化执行模型
基于全异步的执行引擎之上,羲和采用了向量化的查询执行模型。相对于传统的以数据为中心的计算方式,面向算子为中心的计算方式对现代CPU计算更友好:缓存友好的同时,利用乱序执行扩大了CPU的指令并发,利用SIMD又扩大CPU的数据并发,充分挖掘了现代CPU的算力。
面向混合负载的查询执行
羲和分析计算引擎也是新一代云原生数据仓库AnalyticDB MySQL版提供一体化的数仓服务重要内核。面向海量数据的云原生数仓需要满足不同的数据分析场景,包括在线报表,在线交互式分析,以及ETL等。不同的场景依赖分析计算引擎自适应的采用不同的查询优化技术,包括按需的动态代码编译,CPU友好的内存数据布局,以及自适应的并行度调整等。
理解数据和感知存储
作为完整数据仓库的一部分,羲和分析计算引擎,相比单纯的计算引擎,具备感知数据的优势。比如:
- 利用数据分布,直接进行基于特定数据的计算,避免分布式系统中数据和命令流交互的开销。
- 利用数据存储的能力,下推谓词、聚合等计算,实现近存储的计算加速。
- 利用数据模型中的范式依赖,数据数值类型等进行查询执行算法优化。