[ACDU 翻译] MySQL 15.8.10.3 估计 InnoDB 表的 ANALYZE TABLE 复杂性

原创由迪 2022-05-12

1124

ANALYZE TABLE表的复杂性 InnoDB取决于：

采样的页数，由定义 innodb_stats_persistent_sample_pages。
表中的索引列数
分区数。如果表没有分区，则认为分区数为 1。

使用这些参数，估计 ANALYZE TABLE复杂度的近似公式为：

innodb_stats_persistent_sample_pages * 表中索引列数 * 分区数的值

通常，结果值越大，执行时间越长ANALYZE TABLE。

笔记

innodb_stats_persistent_sample_pages 定义在全局级别采样的页数。要设置单个表的抽样页数，请使用 STATS_SAMPLE_PAGES带有 CREATE TABLE或的选项ALTER TABLE。有关更多信息，请参阅第 15.8.10.1 节，“配置持久优化器统计参数”。

如果 innodb_stats_persistent=OFF，则采样的页数由定义 innodb_stats_transient_sample_pages。有关其他信息，请参阅第 15.8.10.2 节，“配置非持久优化器统计参数”。

有关估计复杂性的更深入的方法ANALYZE TABLE，请考虑以下示例。

在Big O 表示法中，ANALYZE TABLE 复杂性被描述为：

 O(n_sample
  * (n_cols_in_uniq_i
     + n_cols_in_non_uniq_i
     + n_cols_in_pk * (1 + n_non_uniq_i))
  * n_part)
复制

在哪里：

n_sample是采样的页数（由定义 innodb_stats_persistent_sample_pages）
n_cols_in_uniq_i是所有唯一索引中所有列的总数（不包括主键列）
n_cols_in_non_uniq_i是所有非唯一索引中所有列的总数
n_cols_in_pk是主键中的列数（如果未定义主键，则在 InnoDB内部创建单列主键）
n_non_uniq_i是表中非唯一索引的数量
n_part是分区数。如果未定义分区，则该表被视为单个分区。

现在，考虑下表（table t），它有一个主键（2 列）、一个唯一索引（2 列）和两个非唯一索引（每列两列）：

CREATE TABLE t (
  a INT,
  b INT,
  c INT,
  d INT,
  e INT,
  f INT,
  g INT,
  h INT,
  PRIMARY KEY (a, b),
  UNIQUE KEY i1uniq (c, d),
  KEY i2nonuniq (e, f),
  KEY i3nonuniq (g, h)
);
复制

对于上述算法所需的列和索引数据，查询 mysql.innodb_index_stats持久索引统计表中的 table t。n_diff_pfx%统计信息显示为每个索引计算的列。例如，列 a和b被计入主键索引。对于非唯一索引，除了用户定义的列之外，还计算主键列 (a,b)。

笔记

有关InnoDB 持久统计表的其他信息，请参阅第 15.8.10.1 节，“配置持久优化器统计参数”

mysql> SELECT index_name, stat_name, stat_description
       FROM mysql.innodb_index_stats WHERE
       database_name='test' AND
       table_name='t' AND
       stat_name like 'n_diff_pfx%';
  +------------+--------------+------------------+
  | index_name | stat_name    | stat_description |
  +------------+--------------+------------------+
  | PRIMARY    | n_diff_pfx01 | a                |
  | PRIMARY    | n_diff_pfx02 | a,b              |
  | i1uniq     | n_diff_pfx01 | c                |
  | i1uniq     | n_diff_pfx02 | c,d              |
  | i2nonuniq  | n_diff_pfx01 | e                |
  | i2nonuniq  | n_diff_pfx02 | e,f              |
  | i2nonuniq  | n_diff_pfx03 | e,f,a            |
  | i2nonuniq  | n_diff_pfx04 | e,f,a,b          |
  | i3nonuniq  | n_diff_pfx01 | g                |
  | i3nonuniq  | n_diff_pfx02 | g,h              |
  | i3nonuniq  | n_diff_pfx03 | g,h,a            |
  | i3nonuniq  | n_diff_pfx04 | g,h,a,b          |
  +------------+--------------+------------------+
复制

根据上面显示的索引统计数据和表定义，可以确定以下值：

n_cols_in_uniq_i，所有唯一索引中所有列的总数，不包括主键列，为2（c和 d）
n_cols_in_non_uniq_i，所有非唯一索引中所有列的总数，为 4 ( e, f, g和h)
n_cols_in_pk，主键中的列数，为 2 (a和 b)
n_non_uniq_i, 表中非唯一索引的数量为 2 (i2nonuniq和 i3nonuniq))
n_part，分区数，为 1。

您现在可以计算 innodb_stats_persistent_sample_pages* (2 + 4 + 2 * (1 + 2)) * 1 以确定扫描的叶页数。innodb_stats_persistent_sample_pages设置为默认值， 20默认页面大小为 16 KiB ( innodb_page_size=16384)，然后您可以估计bytes 为 table 读取20 * 12 * 16384t或大约 4 MiB。

笔记

MiB可能无法从磁盘读取所有 4 个页面，因为某些叶子页面可能已经缓存在缓冲池中。

「喜欢这篇文章，您的关注和赞赏是给作者最好的鼓励」

关注作者

文章被以下合辑收录

朝花夕拾系列13 InnoDB 存储引擎（共102篇）

本系列第13部，欢迎订阅

[ACDU 翻译] MySQL 15.8.10.3 估计 InnoDB 表的 ANALYZE TABLE 复杂性

文章被以下合辑收录

评论