图解MySQL 8.0优化器内部查询解析机制-云原生数据库 PolarDB-阿里云

本文重点介绍了优化器基于规则的其中一部分优化，更多的偏重于SQL中的基本操作符，如表、列、函数、聚合、分组和排序等元素的解析和设置，以及一些显而易见的结构变化。

背景和架构

通过编写程序来动态实现应用所需要的逻辑，从而在程序执行时得到我们需要的结果。数据库就是一种通过输入SQL字符串来快速获取数据的应用。当然，假设没有数据库这种系统应用，用程序如何实现呢？我们可能会发现，即使不管数据如何存储、数据是否并发访问，仍然需要不断通过修改程序处理不同应用对数据的不同请求。比如大数据领域，我们通常通过非关系型数据库的API，实现对数据的获取。然而这种方式虽然入门简单，但是维护极难，而且通用性不强，即使不断进行软件架构设计或者抽象重构，仍然需要不断地变换应用，这也是为何非关系型数据库回头拥抱数据库SQL优化器的原因。

456789

SQL优化器本质上是一种高度抽象化的数据接口的实现，通过该设计，您可以使用更通用且易于理解的SQL语言，对数据进行操作和处理，而不需要关注和抽象自己的数据接口，极大地解放了客户的应用程序。

本文通过图形解说的方式介绍了MySQL 8.0 SQL优化器如何把一个简单的字符串（SQL），变成数据库执行器可以理解的执行序列，最终将数据返还给客户。强大的优化器是不需要客户关注SQL如何写的更好来更快获得需要的数据，因此优化器对原始SQL一定会做一些等价的变化。MySQL 8.0 Server层最新架构详解一文重点介绍了MySQL最新版本关于Server层解析器、优化器和执行器的总体介绍，包括一些代码结构和变化的详细展示，并且通过simple_joins函数抛砖引玉展示了MySQL优化器在逻辑变换中如何简化嵌套Join的优化。本文会一步一步带你进入神奇的优化器细节，详细了解优化器优化部分的每个步骤如何改变着一个SQL最终的执行。

本文基于最新MySQL8.0.25版本，因为优化器转换部分篇幅比较长，将分成两篇文章来介绍，本篇为第一部分，介绍基于基本结构的Setup和Resolve的解析转换过程，第二部分图解MySQL 8.0优化器查询转换篇，介绍更为复杂的子查询、分区表和连接的复杂转换过程，大纲如下：

Setup and Resolve

setup_tables : Set up table leaves in the query block based on list of tables.
resolve_placeholder_tables/merge_derived/setup_table_function/setup_materialized_derived : Resolve derived table, view or table function references in query block.
setup_natural_join_row_types : Compute and store the row types of the top-most NATURAL/USING joins.
setup_wild : Expand all '*' in list of expressions with the matching column references.
setup_base_ref_items : Set query_block's base_ref_items.
setup_fields : Check that all given fields exists and fill struct with current data.
setup_conds : Resolve WHERE condition and join conditions.
setup_group : Resolve and set up the GROUP BY list.
m_having_cond->fix_fields : Setup the HAVING clause.
resolve_rollup : Resolve items in SELECT list and ORDER BY list for rollup processing.
resolve_rollup_item : Resolve an item (and its tree) for rollup processing by replacing items matching grouped expressions with Item_rollup_group_items and updating properties (m_nullable, PROP_ROLLUP_FIELD). Also check any GROUPING function for incorrect column.
setup_order : Set up the ORDER BY clause.
resolve_limits : Resolve OFFSET and LIMIT clauses.
Window::setup_windows1: Set up windows after setup_order() and before setup_order_final().
setup_order_final: Do final setup of ORDER BY clause, after the query block is fully resolved.
setup_ftfuncs : Setup full-text functions after resolving HAVING.
resolve_rollup_wfs : Replace group by field references inside window functions with references in the presence of ROLLUP.

详细转换过程

转换的整个框架是由Query_expression到Query_block调用prepare函数（sql/sql_resolver.cc），并且根据不同转换规则的要求自顶向下或者自底向上的过程。

456789

转换过程如下：

传递null到join的内表列表（propagate_nullability）
解析和设置查询块的leave_tables（setup_tables）
解析查询块Derived Table、View、Table的函数（resolve_placeholder_tables）
将SELECT *的通配符展开成具体的fields（setup_wild）
建立Query_block级别的base_ref_items（setup_base_ref_items）
对select_fields进行fix_fields()和列权限检查（setup_fields）
解析和关联列到Where和Join条件（setup_conds）
解析和设置ROLLUP语句（resolve_rollup）
解析和设置GROUP BY/ORDER BY语句（setup_group/setup_order）
解析和设置Window函数（Window::setup_windows1）

传递null到join的内表列表（propagate_nullability）

Prepare阶段开始要先处理nullable table（该表可能包含全为null的行），根据JOIN关系（top_join_list），null row可以被传播。如果能确定一个table为nullable会使得一些优化退化，例如access method不能为EQ_REF、outer join不能优化为inner join等。

解析和设置查询块的leave_tables（setup_tables）

SELECT
  t1.c1
FROM t1,
     (SELECT
       t2.c1
     FROM t2,
          (SELECT
            t3.c1
          FROM t3
          UNION
          SELECT
            t4.c1
          FROM t4) AS t3a) AS t2a;

未在setup_table调用之前，每个Query_block的leaf_tables是为0的。

456789

该函数的作用就是构建leaf_tables，包括base tables和derived tables列表，用于后续的优化。setup_table并不会递归调用，而是只解决本层的tables，并统计出本层derived table的个数。但是随后会调用resolve_placeholder_tables()->resolve_derived()->derived(Query_expression)::prepare->Query_block::prepare来专门递归处理derived table对应的Query_expression。

456789

解析查询块Derived Table、View、Table的函数（resolve_placeholder_tables）

resolve_placeholder_tables函数用于处理derived table、view和table function。

说明

如果该table已经merged过了，或者是由于使用transform_grouped_to_derived()被调用到，已经决定使用materialized table方式，则直接忽略。

456789

前面已经介绍过resolve_derived()的作用，下面重点介绍merge_derived()函数，merge_derived()的作用是改变Query_expression/Query_block框架结构，将derived table或者view合并到query block中。

merge_derived处理和合并Derived table

merge_derived transformation的先决条件
- 外层query block是否允许merge（allow_merge_derived）：
  - 外层query block为nullptr；
  - 外层query expression的子查询为nullptr，derived table是第一层子查询；
  - 外层的外层query block可以allow_merge_derived=true，或者不包括外层的外层query block话是否为SELECT/SET。
- 外层lex是否可以支持merge（lex->can_use_merged()+lex->can_no_use_merged()）；
- derived table是否已经被标记为需要物化，例如创建视图的方法是CREATE ALGORITHM=TEMPTABLE VIEW（derived_table->algorithm == VIEW_ALGORITHM_TEMPTABLE）；
- 整个derived table所在的查询表达式单元中，不能是（Query_expression::is_mergeable() ）：
  - Union查询；
  - 包含聚集、HAVING、DISTINCT、WINDOWS或者LIMIT；
  - 没有任何table list。
- HINT或者optimizer_switch没有禁止derived_merge；
- heuristic建议合并（derived_query_expression->merge_heuristic(thd->lex)）
  - 如果derived table包含的子查询SELECT list依赖于自己的列时，不支持；
  - 如果是dependant subquery需要多次执行时，不支持；
- derived table中如果查询块包含SEMI/ANTI-JOIN，并指定STRAIGHT_JOIN时，不支持；
- 如果合并的derived table和现有query block的leaf table count大于MAX_TABLES时，不支持。
merge_derived transformation的转换过程
- 利用derived_table->nested_join结构来辅助处理OUTER JOIN的情况。
- 将derived table中的表merge到NESTED_JOIN结构体（derived_table->merge_underlying_tables()）。
- 将derived table中的所有表连接到父查询的table_list列表中，同时把derived table从父查询中删除。
- 对父查询的所有相关数据结构进行重新计算（leaf_table_count，derived_table_count，table_func_count，materialized_derived_table_count，has_sj_nests，has_aj_nests，partitioned_table_count，cond_count，between_count，select_n_having_items）。
- 子查询属性OPTION_SCHEMA_TABLE传递到父查询上（add_base_options()）和如果是外查询JOIN的内表，nullable属性依次向里设置（propagate_nullability()）。
- 合并derived table的where条件到外查询中（merge_where()）。
- 建立对derived table需要获取的列的引用（create_field_translation()）。
- 将Derived table的结构从父查询中删除（exclude_level()）。
- 将derived table中的列或者表的重命名合并到父查询（fix_tables_after_pullout()/repoint_contexts_of_join_nests()）。
- 因为已经把derived table中包含的表merge到了父查询，所以需要对TABLE_LIST中的表所在的位置进行重新定位（remap_tables()）。
- 将derived table合并到父查询之后，需要重新修改原来derived table中所有对derived table中所有列的引用（fix_tables_after_pullout()）。
- 如果derived table中包含ORDER BY语句，并且满足下列条件，derived table将会保留ORDER BY并合并到父查询中，其他情况ORDER BY将会被忽略：
  - 如果父查询允许排序并且正好是只有derived table；
  - 不是一个UNION；
  - 可以有WHERE条件，但是不能有group by或聚合函数；
  - 本身并不是有序的。
  过程简化为：
  看起来官方的derived merge还是不够完美，无法自底向上的递归merge。
  包含的opt trace：
```
trace_derived.add_utf8_table(derived_table)
       .add("select#", derived_query_block->select_number)
       .add("merged", true);

trace_derived.add_alnum("transformations_to_derived_table", "removed_ordering");
```

setup_materialized_derived设置物化Derived Table

对于剩下不能采用merge算法的derived table，会转为物化方式去处理。但此时只是做一些变量设置等预处理，实际的物化执行是在Execute阶段执行。

setup_materialized_derived_tmp_table()：设置一个临时表包含物化derived table的所有行数据。
check_materialized_derived_query_blocks()：设置属于当前derived table所在的查询块结构。

trace_derived.add_utf8_table(this)
       .add("select#", derived->first_query_block()->select_number)
       .add("materialized", true);

setup_table_function处理表函数

如果query block中有table function，整个过程会处理两遍。第一遍会跳过包含table function的表，第二遍专门再对包含table function的表执行一遍上述逻辑。这里的考虑应该是先resolve了外部环境（相对于table function），因为有可能函数参数会依赖外部的derived table。

trace_derived.add_utf8_table(this)
       .add_utf8("function_name", func_name, func_name_len)
       .add("materialized", true);

将SELECT *的通配符展开成具体的fields（setup_wild）

456789

建立Query_block级别的base_ref_items（setup_base_ref_items）

base_ref_items记录了所有Item的位置，方便查询块的其他Item可以进行引用，或者通过Item_ref及其Item_ref子类进行直接引用，例如子查询的引用（Item_view_ref）、聚合函数引用（Item_aggregate_ref）、外查询列的引用（Item_outer_ref）、subquery子查询产生NULL value的引用辅助（Item_ref_null_helper）。如下举例说明比较复杂的Item_outer_ref：

456789

对select_fields进行fix_fields()和列权限检查（setup_fields）

下图是比较复杂的带子查询的fixed field过程。有些field和表关联，有的要添加相应的Item_xxx_ref引用。

456789

解析和关联列到Where和Join条件（setup_conds）

setup_join_cond如果有nested_join，会递归调用setup_join_cond进行解析和设置。此处也同步介绍下simplify_const_condition函数的作用，如果发现可以删除的const Item，则会用Item_func_true/Item_func_false来替代整个的条件，如下图所示：

456789

解析和设置ROLLUP语句（resolve_rollup）

在数据库查询语句中，在GROUP BY表达式之后加上WITH ROLLUP语句，可以实现通过单个查询语句来实现对数据进行不同层级上的分析与统计。

SELECT YEAR,
       country,
       product,
       SUM(profit) AS profit
FROM sales
GROUP BY YEAR,
         country,
         product WITH ROLLUP;

+------+-------------+------------+--------+
| year | country     | product    | profit |
+------+-------------+------------+--------+
| 2000 | Finland     | Computer   |   1500 |
| 2000 | Finland     | Phone      |    100 |
| 2000 | Finland     | NULL       |   1600 |
| 2000 | Singapore   | Calculator |    150 |
| 2000 | Singapore   | Computer   |   1200 |
| 2000 | Singapore   | NULL       |   1350 |
| 2000 | USA         | Calculator |     75 |
| 2000 | USA         | Computer   |   1500 |
| 2000 | USA         | NULL       |   1575 |
| 2000 | NULL        | NULL       |   4525 |
| 2001 | Finland     | Phone      |     10 |
| 2001 | Finland     | NULL       |     10 |
| 2001 | USA         | Calculator |     50 |
| 2001 | USA         | Computer   |   2700 |
| 2001 | USA         | TV         |    250 |
| 2001 | USA         | NULL       |   3000 |
| 2001 | NULL        | NULL       |   3010 |
| NULL | NULL        | NULL       |   7535 |
+------+-------------+------------+--------+

# 相当于做了下面的查询：

SELECT *
FROM
  (SELECT YEAR,
          country,
          product,
          SUM(profit) AS profit
   FROM sales
   GROUP BY YEAR,
            country,
            product
   UNION ALL SELECT YEAR,
                    country,
                    NULL,
                    SUM(profit) AS profit
   FROM sales
   GROUP BY YEAR,
            country
   UNION ALL SELECT YEAR,
                    NULL,
                    NULL,
                    SUM(profit) AS profit
   FROM sales
   GROUP BY YEAR
   UNION ALL SELECT NULL,
                    NULL,
                    NULL,
                    SUM(profit) AS profit
   FROM sales) AS sum_table
ORDER BY YEAR, country, product;

+------+-------------+------------+--------+
| YEAR | country     | product    | profit |
+------+-------------+------------+--------+
| NULL | NULL        | NULL       |   7535 |
| 2000 | NULL        | NULL       |   4525 |
| 2000 | Finland     | NULL       |   1600 |
| 2000 | Finland     | Computer   |   1500 |
| 2000 | Finland     | Phone      |    100 |
| 2000 | Singapore   | NULL       |   1350 |
| 2000 | Singapore   | Calculator |    150 |
| 2000 | Singapore   | Computer   |   1200 |
| 2000 | USA         | NULL       |   1575 |
| 2000 | USA         | Calculator |     75 |
| 2000 | USA         | Computer   |   1500 |
| 2001 | NULL        | NULL       |   3010 |
| 2001 | Finland     | NULL       |     10 |
| 2001 | Finland     | Phone      |     10 |
| 2001 | USA         | NULL       |   3000 |
| 2001 | USA         | Calculator |     50 |
| 2001 | USA         | Computer   |   2700 |
| 2001 | USA         | TV         |    250 |
+------+-------------+------------+--------+

排序由于有NULL的问题，所以分级汇总的效果非常难处理，而且group列不同改变，SQL复杂度来回变化，而ROLLUP很简单就可以实现效果，下图展示了ROLLUP在解析过程中做了怎样的转换。

456789

解析和设置GROUP BY/ORDER BY语句（setup_group/setup_order）

其中一个函数find_order_in_list()，表示尝试在select fields里去寻找可以映射的列，否则就得在最后投影的all fields里加上当前列，同时也做fix_fields。

456789

说明：

m_having_cond->fix_fields：对having条件进行fixed_fields。
resolve_limits：处理OFFSET和LIMIT子句（offset_limit和select_limit的Items）。
setup_ftfuncs：如果有full-text的函数，对相关Item进行fix_fields。
remove_redundant_subquery_clauses：对于Table Subquery的表达式，通常是IN/ANY/ALL/EXISTS/etc，如果没有聚合函数和Having子句，通常可以考虑删除不必要的ORDER/DISTINCT/GROUP BY。该函数支持三种REMOVE_ORDER | REMOVE_DISTINCT | REMOVE_GROUP，如果是SINGLEROW_SUBS的子查询，只考虑删除REMOVE_ORDER。
```
select c1 from t1 where t1.c2 in (select distinct c1 from t2 group by c1, c2 order by c1);
转化为 =>
select c1 from t1 where t1.c2 in (select c1 from t2);
```
处理是否可以删除不必要的distinct语句，删除的条件就是GROUP BY的列都在SELECT列表中，并且没有ROLLUP和Window函数。
```
is_grouped() && hidden_group_field_count == 0 && olap == UNSPECIFIED_OLAP_TYPE
```
例如场景：
```
SELECT DISTINCT c1, max(c2) from t1 group by c1;
```

解析和设置Window函数（Window::setup_windows1）

SELECT id,
       release_year,
       rating,
       avg(rating) over(PARTITION BY release_year) AS year_avg
FROM tw;

+------+--------------+--------+-------------------+
| id   | release_year | rating | year_avg          |
+------+--------------+--------+-------------------+
|    1 |         2015 |      8 |               8.5 |
|    3 |         2015 |      9 |               8.5 |
|    2 |         2015 |    8.5 |               8.5 |
|    4 |         2016 |    8.2 |               8.3 |
|    5 |         2016 |    8.4 |               8.3 |
|    6 |         2017 |      7 |                 7 |
+------+--------------+--------+-------------------+

执行的过程和结果类似于下图：

456789

我们看下它在开始Query_block::prepare解析过程做了哪些事情：

如果Query_block存在至少一个window函数，就调用Window::setup_windows1

遍历window函数列表，调用resolve_window_ordering来解析m_partition_by和m_order_by。
处理inter-window的引用关系（如WINDOW w1 AS (w2), w2 AS (), w3 AS (w1)），但必须是一个有向无环图（DAG）。
重新遍历检查是否唯一名字check_unique_name、创建window partition by和window order by的引用items。
检查窗口函数特征（Window::check_window_functions1(THD *thd, Query_block *select)）。
- 首先判断的是当前是静态窗口还是动态窗口；静态窗口即判断了frame的定义是否有定义上下边界。m_static_aggregates为true，意味着是静态窗口，同时对每一个分区都可以进行一次评估。如果m_static_aggregates为false，则进一步判断其滑动窗口使用的是基于范围还是基于行。m_row_optimizable基于行，m_range_optimizable基于范围。
- 获取聚合函数作为窗口函数的时候，窗口的特殊规格要求wfs->check_wf_semantics1(thd, select, &reqs) ，这个方法其实就是判断是不是需要row_buffer作为评估，如果我们只看当前分区的行无法进行正确的计算不需要，如果要看之后的或者之前的行，就需要使用row_buffer。

背景和架构

详细转换过程

传递null到join的内表列表（propagate_nullability）

解析和设置查询块的leave_tables（setup_tables）

解析查询块Derived Table、View、Table的函数 （resolve_placeholder_tables）

将SELECT *的通配符展开成具体的fields（setup_wild）

建立Query_block级别的base_ref_items（setup_base_ref_items）

对select_fields进行fix_fields()和列权限检查（setup_fields）

解析和关联列到Where和Join条件（setup_conds）

解析和设置ROLLUP语句（resolve_rollup）

解析和设置GROUP BY/ORDER BY语句（setup_group/setup_order）

解析和设置Window函数（Window::setup_windows1）

解析查询块Derived Table、View、Table的函数（resolve_placeholder_tables）