全部产品

SQL调优基础概念

更新时间:2020-09-01 13:41:17

在使用PolarDB-X的过程中,因为种种原因,可能出现性能不符合预期的慢SQL。SQL调优的过程,就是通过分析SQL的执行计划、各阶段运行时长等信息,找出拖慢SQL执行的原因,继而解决问题。

SQL调优的过程中,首先要理解何为PolarDB-X的执行计划,这是一切调优的基础:执行计划告诉我们一条 SQL 是怎样执行的

PolarDB-X架构

PolarDB-X既可以被看作一个中间件,也可以被看作一个支持计算存储分离架构的数据库产品。当一条查询SQL(称为逻辑SQL)发往PolarDB-X节点时,我们会将其分成可下推的、和不可下推的两部分,如下图所示。可下推的部分也被称为物理 SQL


架构

原则上,PolarDB-X会:

  • 尽可能将用户 SQL 下推到 MySQL 上执行
  • 对于无法下推的部分算子,选择最优的方式来执行

下推和执行计划

EXPLAIN 指令将会打印 SQL 的执行计划。它的用法非常简单:只要在 SQL 最前面加上 EXPLAIN 即可。下面我们通过几个例子来探索一下PolarDB-X的执行方式。

例子一:

  1. > explain select c_custkey, c_name, c_address from customer where c_custkey = 42;
  2. LogicalView(tables="customer_2", sql="SELECT `c_custkey`, `c_name`, `c_address` FROM `customer` AS `customer` WHERE (`c_custkey` = ?)")

对于点查(主键查询)来说,PolarDB-X只要将 SQL 直接下发到主键对应的分片上即可。因此,执行计划中只有一个 LogicalView 算子,下发的物理 SQL 基本和逻辑 SQL 是一样的。

LogicalView 算子代表下推到 MySQL 执行的查询,更多信息请参见查询计划和基本算子

例子二:

  1. > explain select c_nationkey, count(*) from customer group by c_nationkey;
  2. HashAgg(group="c_nationkey", count(*)="SUM(count(*))")
  3. Gather(concurrent=true)
  4. LogicalView(tables="customer_[0-7]", shardCount=8, sql="SELECT `c_nationkey`, COUNT(*) AS `count(*)` FROM `customer` AS `customer` GROUP BY `c_nationkey`")

上述查询会统计:各个国家的客户数量分别有多少?考虑到分库分表,我们可以将它分成两个阶段来进行:

  1. 首先,在各个分表上进行 COUNT(*) 统计(这一步可被下推到 MySQL 上执行)
  2. 将结果汇总,将 COUNT(*) 的结果求 SUM(),得到最终的结果 (这一步需要PolarDB-X节点来完成)

从执行计划上,也可以看出这一点。其中:

  • LogicalView 表示下发到各个分片的SQL按 nation 分组进行count(*)统计。
  • Gather 算子表示收集各个分片的结果。
  • HashAgg 是聚合(Aggregate)的一种实现方式,以c_nationkey作为分组键将COUNT(*)的结果求SUM()

更多的例子,请参见执行计划和基本算子