什么是弹性并行查询_云原生数据库 PolarDB(PolarDB)-阿里云帮助中心

PolarDB MySQL版8.0版本重磅推出弹性并行查询框架，当您的查询数据量到达一定阈值，就会自动启动并行查询框架，从而使查询耗时指数级下降。

功能简介

弹性并行查询（Elastic Parallel Query，ePQ）目前支持单机并行和多机并行两种并行引擎，单机并行引擎等效于原有的并行查询，多机并行引擎支持集群内跨节点的自适应弹性调度。

PolarDB MySQL版8.0.1版本支持单机并行查询，查询时在存储层将数据分片到不同的线程上，单个节点内多个线程并行计算，将结果流水线汇总到总线程。最后总线程做简单归并返回给用户，提高查询效率。

PolarDB MySQL版8.0.2版本除了支持原有的单机并行查询，又将线性加速能力提升了一个等级，引入了多节点分布式并行计算能力，即多机并行查询。基于代价将执行计划优化为更灵活的并行执行计划，改进了单机并行查询可能存在的Leader单点瓶颈和Worker负载不均衡的问题，同时突破了单个节点在CPU、Memory、IO上的资源瓶颈。基于多节点的资源视图，自适应的调度并行计算任务，在大幅提升并行计算能力、降低查询延迟的同时，平衡了各节点的资源负载，提升集群整体的资源利用率。

弹性并行查询（Elastic Parallel Query）针对云上用户实例CPU资源利用率较低、使用不均衡的特征，充分挖掘集群中多核CPU的并行处理能力，以8核32 GB（独享规格）的PolarDB MySQL版集群版为例，示意图如下所示：

456789

前提条件

PolarDB集群版本需为PolarDB MySQL版8.0版本且修订版本需满足如下条件：

单机并行：8.0.1.0.5或以上。
单机并行：8.0.2.1.4.1或以上。
多机并行：8.0.2.2.6或以上。

如何查看集群版本，请参见查询版本号。

应用场景

并行查询适用于大部分SELECT语句，例如大表查询、多表连接查询、计算量较大的查询。对于非常短的查询，效果并不显著。同时由于并行方式的多样化，可以适用于多种广泛而灵活的应用场景：

海量数据分析场景
在中等及更大规模数据量的情况下，分析类业务的报表查询SQL通常复杂且比较耗费时间，通过开启并行查询可以线性降低查询的响应时间。
资源负载不均衡场景
集群内的多个节点可以借助数据库代理的负载均衡能力，使每个节点的并发连接数大致相同。但由于不同查询的计算复杂度、资源使用方式各有差异，基于连接数的load balance无法完全避免节点间负载不均衡的问题。同所有分布式数据库一样，热点节点也会对PolarDB造成一定的负面影响：
1. 如果RO节点过热使得查询执行过慢，可能造成RW节点无法purge undo log导致磁盘空间膨胀。
2. 如果RO节点过热导致redo apply过慢，会导致RW节点无法刷脏降低RW节点的写吞吐性能。
弹性并行查询引入全局资源视图机制，并基于该视图做自适应调度，依据各节点的资源利用率和数据亲和性反馈，将查询的部分甚至全部子任务调度到有空闲资源的节点上，在保证目标并行度的基础上均衡集群资源使用率。
弹性计算场景
如前所述，弹性是云原生数据库的PolarDB的核心能力之一，自动扩、缩容功能提供了对短查询类业务非常友好的弹性能力，但之前并不适用于复杂分析类业务，因为对于大查询场景，单条查询仍无法通过增加节点实现提速。而现在开启弹性并行查询（ePQ）的集群，新扩展的节点会自动加入到集群分组中共享计算资源，弥补了之前弹性能力上的这一短板。
在离线业务混合场景
前面提到了多个子集群的物理资源隔离能力，最彻底的隔离方式是将在线交易业务和离线分析业务划定为不同节点集合，但如果用户在意成本，这种模式会显得有些浪费。因为很多情况下，在、离线业务会有不同的高、低峰特性，更经济的方式是通过错峰使用，让不同业务共享部分集群资源，但使用不同的集群地址承接业务。通过开启弹性并行，让离线业务重叠使用在线业务低峰期的空闲资源，进一步降本增效。

使用说明

关于如何使用弹性并行查询，请参见使用说明。

性能指标

本次测试将使用TPC-H生成100 GB数据来测试PolarDB MySQL版8.0版本集群的性能指标。测试用的PolarDB集群规格为32核256 GB（独享规格）×4节点，单节点并行度max_parallel_degree分别设置为32和0，对比PolarDB串行执行、单节点32并行度执行、4节点128并行度执行的性能数据，具体测试步骤请参见并行查询性能。

456789

通过以上测试结果图得出，TPC-H中100%的SQL可以被加速，平均加速比在17倍，最高加速比56倍。

开启多机并行后，平均加速比在59倍，最高加速比159倍。

说明本文的TPC-H的实现基于TPC-H的基准测试，并不能与已发布的TPC-H基准测试结果相比较，本文中的测试并不符合TPC-H基准测试的所有要求。

并行执行EXPLAIN

更多关于EXPLAIN执行计划输出中与并行查询相关的内容，请参见使用EXPLAIN查看并行计划。

免费体验

阿里云提供了数据库解决方案功能体验馆，提供了真实免费的PolarDB集群环境和开箱即用的测试方法，您可以在线快捷体验ePQ带来的查询效率提升。

您可前往弹性并行查询ePQ进行体验，详情请参见免费体验弹性并行查询ePQ。

概述