PolarDB MySQL之弹性并行查询（Elastic Parallel Query）

xiaozhuo 2023-06-19

399

PolarDB MySQL版8.0版本重磅推出弹性并行查询框架，当您的查询数据量到达一定阈值，就会自动启动并行查询框架，从而使查询耗时指数级下降。

弹性并行查询（Elastic Parallel Query，ePQ）目前支持单机并行和多机并行两种并行引擎，单机并行引擎等效于原有的并行查询，多机并行引擎支持集群内跨节点的自适应弹性调度。

PolarDB MySQL版8.0.1版本支持单机并行查询，查询时在存储层将数据分片到不同的线程上，单个节点内多个线程并行计算，将结果流水线汇总到总线程。最后总线程做简单归并返回给用户，提高查询效率。

PolarDB MySQL版8.0.2版本除了支持原有的单机并行查询，又将线性加速能力提升了一个等级，引入了多节点分布式并行计算能力，即多机并行查询。基于代价将执行计划优化为更灵活的并行执行计划，改进了单机并行查询可能存在的Leader单点瓶颈和Worker负载不均衡的问题，同时突破了单个节点在CPU、Memory、IO上的资源瓶颈。基于多节点的资源视图，自适应的调度并行计算任务，在大幅提升并行计算能力、降低查询延迟的同时，平衡了各节点的资源负载，提升集群整体的资源利用率。

弹性并行查询（Elastic Parallel Query）针对云上用户实例CPU资源利用率较低、使用不均衡的特征，充分挖掘集群中多核CPU的并行处理能力，以8核32 GB（独享规格）的PolarDB MySQL版集群版为例，示意图如下所示：

456789

前提条件

PolarDB集群版本需为PolarDB MySQL版8.0版本且修订版本需满足如下条件：

单机并行：8.0.1.0.5或以上。
单机并行：8.0.2.1.4.1或以上。
多机并行：8.0.2.2.6或以上。

如何查看集群版本，请参见查询版本号。

应用场景

并行查询适用于大部分SELECT语句，例如大表查询、多表连接查询、计算量较大的查询。对于非常短的查询，效果并不显著。同时由于并行方式的多样化，可以适用于多种广泛而灵活的应用场景：

海量数据分析场景
在中等及更大规模数据量的情况下，分析类业务的报表查询SQL通常复杂且比较耗费时间，通过开启并行查询可以线性降低查询的响应时间。
资源负载不均衡场景
集群内的多个节点可以借助数据库代理的负载均衡能力，使每个节点的并发连接数大致相同。但由于不同查询的计算复杂度、资源使用方式各有差异，基于连接数的load balance无法完全避免节点间负载不均衡的问题。同所有分布式数据库一样，热点节点也会对PolarDB造成一定的负面影响：
1. 如果RO节点过热使得查询执行过慢，可能造成RW节点无法purge undo log导致磁盘空间膨胀。
2. 如果RO节点过热导致redo apply过慢，会导致RW节点无法刷脏降低RW节点的写吞吐性能。
弹性多机并行引入全局资源视图机制，并基于该视图做自适应调度，依据各节点的资源利用率和数据亲和性反馈，将查询的部分甚至全部子任务调度到有空闲资源的节点上，在保证目标并行度的基础上均衡集群资源使用率。
弹性计算场景
如前所述，弹性是云原生数据库的PolarDB的核心能力之一，自动扩、缩容功能提供了对短查询类业务非常友好的弹性能力，但之前并不适用于复杂分析类业务，因为对于大查询场景，单条查询仍无法通过增加节点实现提速。而现在开启弹性并行查询（ePQ）的集群，新扩展的节点会自动加入到集群分组中共享计算资源，弥补了之前弹性能力上的这一短板。
在离线业务混合场景
前面提到了多个子集群的物理资源隔离能力，最彻底的隔离方式是将在线交易业务和离线分析业务划定为不同节点集合，但如果用户在意成本，这种模式会显得有些浪费。因为很多情况下，在、离线业务会有不同的高、低峰特性，更经济的方式是通过错峰使用，让不同业务共享部分集群资源，但使用不同的集群地址承接业务。通过开启弹性并行，让离线业务重叠使用在线业务低峰期的空闲资源，进一步降本增效。

使用说明

说明只读节点和主节点都支持并行查询功能。主节点上并行查询默认关闭。

开启并行查询
在控制台基本信息的集群地址区域，单击编辑配置，打开编辑地址配置页面，设置并行度参数及并行引擎，开启并行查询。具体操作请参见配置数据库代理的并行查询说明。
并行查询推荐设置以及相关说明如下：
- 多机并行引擎可以根据查询代价以及集群实时负载情况自适应弹性调度，建议开启多机并行以获得更优的加速效果。
- 并行度参数从低到高逐渐增加，建议不要超过CPU核数的四分之一。例如，刚开始使用并行查询时，设置并行度参数为2，试运行一天后，如果CPU压力不大，可以持续上调；如遇到CPU压力较大，停止上调。
- 并行度为单个查询在单计算节点内最大允许同时运行的worker线程数，如果选择多机并行，单个查询最大允许同时运行的线程数=并行度×节点个数。
- 打开并行查询功能时，需要设置innodb_adaptive_hash_index参数为OFF，innodb_adaptive_hash_index参数开启会影响并行查询的性能。
说明
- 如果控制台页面未开启并行查询，但系统参数max_parallel_degree被设置为大于0时，相当于默认开启了单机并行。
- 如果控制台和系统参数max_parallel_degree均有设置，则以控制台参数配置为准，故建议使用控制台开启并行查询。
关闭并行查询
在控制台基本信息的集群地址区域，单击编辑配置，打开编辑地址配置页面，可关闭并行查询，具体操作请参见配置数据库代理。
说明控制台关闭并行查询后，需要确认系统参数max_parallel_degree同时为0，确保并行查询被完全关闭。
通过Hint来控制并行查询
使用Hint语法可以对单个语句进行控制，例如系统默认关闭并行查询情况下，但需要对某个高频的慢SQL查询进行加速，此时就可以使用Hint对特定SQL进行加速。详情内容请参见通过Hint控制。
设置阈值控制优化器是否选择并行执行
PolarDB提供了两个阈值来控制优化器是否选择并行执行，SQL语句只要满足其中任意一个条件，优化器就会考虑并行执行。
- records_threshold_for_parallelism
  若优化器估算出语句中存在扫描记录数超过该阈值的表，优化器会考虑选择并行执行计划。默认值为10000。若您的业务量较小或复杂查询业务并发较低，您可以选择将该阈值设置为2000或以上。
  说明上文提到的扫描记录数是根据对应表的统计信息进行估算得出的值，可能存在一定的误差。
- cost_threshold_for_parallelism
  若优化器估算查询的串行执行代价超过该阈值，优化器会考虑选择并行执行计划。默认值为50000。
设置阈值控制多机并行引擎的自适应弹性调度
PolarDB提供了两个阈值来控制是否选择多机并行，SQL语句只要满足如下任意一个条件，并行查询会考虑弹性扩展为多机并行。
- records_threshold_for_mpp
  若查询语句中存在扫描记录超过该阈值的表，优化器会考虑将单机并行弹性扩展为多机并行，将并行任务调度到多个节点上同时完成计算。默认值为records_threshold_for_parallelism的N倍，N值为当前集群地址内的节点个数。
- cost_threshold_for_mpp
  若查询语句的串行执行代价超过该阈值，优化器会考虑弹性扩展为多机并行。默认值为cost_threshold_for_parallelism的N倍，N值为当前集群地址内的节点个数。

表 1. 系统参数
参数名	级别	描述
max_parallel_degree	Global、Session	单个查询的最大并行度，即并行执行的最大Worker数量。取值范围：[0-1024]；默认值：0，表示关闭并行查询。说明 PolarDB优化器可能会对主查询和子查询分别并行执行，如果同时并行执行，它们的最大Worker数不能超过max_parallel_degree的值，整个查询使用的Worker数为主查询和子查询使用的Worker数之和。
parallel_degree_policy	Global	设置单个查询的并行度配置策略，取值范围如下： `TYPICAL`：PolarDB选择查询并行度时不会考虑数据库负载（如CPU使用率等），而尽可能与`max_parallel_degree`设置的并行度保持一致。 `AUTO`：PolarDB会根据数据库负载（如CPU使用率等）来决定是否禁止并行查询计划，并会根据查询代价选择并行度。 `REPLICA_AUTO`（默认）：仅只读节点会根据数据库负载（如CPU使用率等）决定是否禁止并行查询计划，并会根据查询代价选择并行度，而主节点不会开启并行查询。说明更多关于并行度配置策略的详细介绍，请参见并行度控制策略。
parallel_workers_policy	session	弹性并行策略： LOCAL：节点内并行，即单机并行。 AUTO：开启弹性并行，会根据集群分组内节点的实时负载信息做调度，本地节点计算资源不足时，会尝试选择其它有空闲资源的节点调度执行。查询代价超过阈值后选择多机并行。 MULTI_NODE：强制多机并行，最大并行度会随节点数增加而成倍增加，适用于海量数据的分析类大查询。
records_threshold_for_parallelism	Session	若优化器估算出语句中存在扫描记录数超过该阈值的表，优化器会考虑选择并行执行计划。取值范围：[0-18446744073709551615]；默认值：10000。说明若您的业务量较小或复杂查询业务并发较低，您可以选择将该阈值设置为2000或以上。
cost_threshold_for_parallelism	Session	若优化器估算查询的串行执行代价超过该阈值，优化器会考虑选择并行执行计划。取值范围：[0-18446744073709551615]；默认值：50000。
records_threshold_for_mpp	session	查询语句中表扫描行数超过该阈值后，优化器会考虑选择多机并行执行方式。取值范围：[0-18446744073709551615]；默认为0，含义是自动取值records_threshold_for_parallelism的N倍，N为ePQ集群的节点个数。
cost_threshold_for_mpp	session	查询语句的串行执行代价超过该阈值后，优化器会考虑选择多机并行执行方式。取值范围：[0-18446744073709551615]；默认值为0，含义是自动取值cost_threshold_for_parallelism的N倍，N为节点个数。

表 2. 状态变量
变量名	级别	描述
Parallel_workers_created	Session、Global	从Session启动开始，生成Parallel Worker的个数。
Gather_records	Session、Global	Gather记录总数。
PQ_refused_over_total_workers	Session、Global	由于总Worker数限制没有启用并行的查询数。
PQ_refused_over_max_queuing_time	Session、Global	由于并行查询排队超时没有启动并行的查询数。
Total_running_parallel_workers	Global	当前正在运行的Parallel Worker的数目。

性能指标

本次测试将使用TPC-H生成100 GB数据来测试PolarDB MySQL版8.0版本集群的性能指标。测试用的PolarDB集群规格为32核256 GB（独享规格）×4节点，单节点并行度max_parallel_degree分别设置为32和0，对比PolarDB串行执行、单节点32并行度执行、4节点128并行度执行的性能数据，具体测试步骤请参见并行查询性能。

通过以上测试结果图得出，TPC-H中100%的SQL可以被加速，平均加速比在17倍，最高加速比56倍。

开启多机并行后，平均加速比在59倍，最高加速比159倍。

说明本文的TPC-H的实现基于TPC-H的基准测试，并不能与已发布的TPC-H基准测试结果相比较，本文中的测试并不符合TPC-H基准测试的所有要求。

并行执行EXPLAIN

更多关于EXPLAIN执行计划输出中与并行查询相关的内容，请参见并行查询EXPLAIN。

PolarDB MySQL之弹性并行查询（Elastic Parallel Query）

前提条件

应用场景

使用说明

相关参数和变量

性能指标

并行执行EXPLAIN

相关概念

评论

相关阅读