暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

DB吐槽大会,第73期 - PG 统计信息无法迁移

原创 digoal 2022-01-20
282

作者

digoal

日期

2021-10-04

标签

PostgreSQL , 统计信息


视频回放

1、产品的问题点
- PG 统计信息无法迁移

2、问题点背后涉及的技术原理
- PG 的优化器需要依靠统计信息来计算SQL的代价、选择性等.
- 统计信息包括记录数、SIZE、每一列的高频词、柱状图、唯一值个数、等等.
- PG 支持表达式统计信息、自定义多列统计信息等.
- PG 支持手工的analyze, vacuum analyze语法来生成统计信息.
- 但是PG的统计信息无法导出、导入, 如果发生备份恢复动作, 需要重新收集统计信息.

3、这个问题将影响哪些行业以及业务场景
- 通用
- 通常发生在大版本升级、大量数据逻辑迁移或恢复的场景中.

4、会导致什么问题?
- 大版本升级后, 无统计信息, 如果数据库立即开放给业务使用, 可能导致执行计划不准确, 引起性能问题甚至影响业务
- 大量数据通过逻辑导出导入时, 导入结束后需要收集统计信息, 如果未及时收集统计信息就开放给业务使用的话, 可能导致SQL执行计划不准确, 引起性能问题甚至影响业务

5、业务上应该如何避免这个坑
- 大版本升级、大量数据通过逻辑导出导入后, 收集统计信息后再开放给业务使用.

6、业务上避免这个坑牺牲了什么, 会引入什么新的问题
- 收集统计信息需要扫描数据, 相比直接导出导入更耗时.

7、数据库未来产品迭代如何修复这个坑
- 希望内核层面支持统计信息导出、导入.
- https://postgrespro.com/docs/enterprise/13/dump-stat

PostgreSQL 许愿链接

您的愿望将传达给PG kernel hacker、数据库厂商等, 帮助提高数据库产品质量和功能, 说不定下一个PG版本就有您提出的功能点. 针对非常好的提议,奖励限量版PG文化衫、纪念品、贴纸、PG热门书籍等,奖品丰富,快来许愿。开不开森.

9.9元购买3个月阿里云RDS PostgreSQL实例

PostgreSQL 解决方案集合

德哥 / digoal's github - 公益是一辈子的事.

digoal's wechat

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论