暂无图片
暂无图片
1
暂无图片
暂无图片
暂无图片

[ACDU 翻译] MySQL 15.8.10.3 估计 InnoDB 表的 ANALYZE TABLE 复杂性

原创 由迪 2022-05-12
1124

ANALYZE TABLE表的复杂性 InnoDB取决于:

使用这些参数,估计 ANALYZE TABLE复杂度的近似公式为:

innodb_stats_persistent_sample_pages * 表中索引列数 * 分区数的 值

通常,结果值越大,执行时间越长ANALYZE TABLE

笔记

innodb_stats_persistent_sample_pages 定义在全局级别采样的页数。要设置单个表的抽样页数,请使用 STATS_SAMPLE_PAGES带有 CREATE TABLE或 的选项ALTER TABLE。有关更多信息,请参阅第 15.8.10.1 节,“配置持久优化器统计参数”

如果 innodb_stats_persistent=OFF,则采样的页数由 定义 innodb_stats_transient_sample_pages。有关其他信息,请参阅第 15.8.10.2 节,“配置非持久优化器统计参数”

有关估计复杂性的更深入的方法ANALYZE TABLE,请考虑以下示例。

Big O 表示法中,ANALYZE TABLE 复杂性被描述为:

 O(n_sample
  * (n_cols_in_uniq_i
     + n_cols_in_non_uniq_i
     + n_cols_in_pk * (1 + n_non_uniq_i))
  * n_part)
复制

在哪里:

  • n_sample是采样的页数(由 定义 innodb_stats_persistent_sample_pages
  • n_cols_in_uniq_i是所有唯一索引中所有列的总数(不包括主键列)
  • n_cols_in_non_uniq_i是所有非唯一索引中所有列的总数
  • n_cols_in_pk是主键中的列数(如果未定义主键,则在 InnoDB内部创建单列主键)
  • n_non_uniq_i是表中非唯一索引的数量
  • n_part是分区数。如果未定义分区,则该表被视为单个分区。

现在,考虑下表(table t),它有一个主键(2 列)、一个唯一索引(2 列)和两个非唯一索引(每列两列):

CREATE TABLE t ( a INT, b INT, c INT, d INT, e INT, f INT, g INT, h INT, PRIMARY KEY (a, b), UNIQUE KEY i1uniq (c, d), KEY i2nonuniq (e, f), KEY i3nonuniq (g, h) );
复制

对于上述算法所需的列和索引数据,查询 mysql.innodb_index_stats持久索引统计表中的 table tn_diff_pfx%统计信息显示为每个索引计算的列。 例如,列 ab被计入主键索引。对于非唯一索引,除了用户定义的列之外,还计算主键列 (a,b)。

笔记

有关InnoDB 持久统计表的其他信息,请参阅 第 15.8.10.1 节,“配置持久优化器统计参数”

mysql> SELECT index_name, stat_name, stat_description FROM mysql.innodb_index_stats WHERE database_name='test' AND table_name='t' AND stat_name like 'n_diff_pfx%'; +------------+--------------+------------------+ | index_name | stat_name | stat_description | +------------+--------------+------------------+ | PRIMARY | n_diff_pfx01 | a | | PRIMARY | n_diff_pfx02 | a,b | | i1uniq | n_diff_pfx01 | c | | i1uniq | n_diff_pfx02 | c,d | | i2nonuniq | n_diff_pfx01 | e | | i2nonuniq | n_diff_pfx02 | e,f | | i2nonuniq | n_diff_pfx03 | e,f,a | | i2nonuniq | n_diff_pfx04 | e,f,a,b | | i3nonuniq | n_diff_pfx01 | g | | i3nonuniq | n_diff_pfx02 | g,h | | i3nonuniq | n_diff_pfx03 | g,h,a | | i3nonuniq | n_diff_pfx04 | g,h,a,b | +------------+--------------+------------------+
复制

根据上面显示的索引统计数据和表定义,可以确定以下值:

  • n_cols_in_uniq_i,所有唯一索引中所有列的总数,不包括主键列,为2(cd
  • n_cols_in_non_uniq_i,所有非唯一索引中所有列的总数,为 4 ( e, f, gh)
  • n_cols_in_pk,主键中的列数,为 2 (ab)
  • n_non_uniq_i, 表中非唯一索引的数量为 2 (i2nonuniqi3nonuniq))
  • n_part,分区数,为 1。

您现在可以计算 innodb_stats_persistent_sample_pages* (2 + 4 + 2 * (1 + 2)) * 1 以确定扫描的叶页数。innodb_stats_persistent_sample_pages设置为默认值, 20默认页面大小为 16 KiB ( innodb_page_size=16384),然后您可以估计bytes 为 table 读取20 * 12 * 16384t或大约 4 MiB

笔记

MiB可能无法从磁盘读取 所有 4 个页面,因为某些叶子页面可能已经缓存在缓冲池中。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论