VisualPlan通过图形化的形式展示查询实际执行过程中使用的执行计划。有关查询性能问题定位的更多信息,可参见如何诊断慢查询

VisualPlan按照Stage进行划分。最下边表示最上游的Stage,最上游Stage一般需要从源表读取和过滤数据。箭头表示数据的流向。在Stage内部,数据处理逻辑使用算子组合表示,箭头方向表示数据在算子间的流向。

StageSummary
StageSummary表示当前stage所有task重要指标的累加值,具体包括:VisualPlan
  • Output:当前Stage的输出数据量大小和输出行数。
  • Stage:当前Stage的StageId,和详情页的StageId对应。
  • State:当前Stage的最终状态。
  • Operator Cost:当前Stage在执行过程中的消耗的CPU Time总和,是多机多线程的累加值。
  • Peak Memory:当前Stage在执行过程中使用的峰值内存大小。
  • Input:当前Stage的输出数据量大小和输入行数。
估算信息
估算信息Est. I/O:表示某个算子估算的输入和输出行数。如果是Join算子,则只有估算的输出行数,没有估算的输入行数。估算信息是在优化器优化阶段,使用特定方法对输出行数不确定的算子进行的数据量估计,从而在执行计划的优化阶段选择较优的执行计划。如果估算值和实际值相差较大,可能会导致使用较差的执行计划,最终导致查询消耗较大的服务器资源或者导致慢查询的产生。
算子
有关算子的更多信息,可参见算子