暂无图片
postgresql analyze分区表耗时较长
我来答
分享
执剑者
2020-10-30
postgresql analyze分区表耗时较长

有个问题,请教一下各位专家。pg里面有一张分区表,大小6T,采样参数default_statistics_target默认100,但pg_class里面该表的relpages有30多亿。目前,对该表analyze耗时较长,大概每次都需要一个多小时。请问表数据量较大以及统计信息估算值较大的情况下对analyze时间是否有直接影响?

我来答
添加附件
收藏
分享
问题补充
3条回答
默认
最新
彭冲

可以试试 1.降低采样比例default_statistics_target, 这个可以对单表或者单列设置 2.analyze降低范围,比如只对频繁修改的列做

暂无图片 评论
暂无图片 有用 0
打赏 0
高云龙

数据量对analyze执行时间肯定有影响的,可以考虑对分区子表做二级分区,细化数据分区范围,并且只分析热数据分区,历史数据分区不需要每次都做

暂无图片 评论
暂无图片 有用 0
打赏 0
彭冲

补充一下楼主的问题描述:
数据库是高斯200,使用的列存表,楼主反馈客户对单个分区做analyze,实际上还是全表analyze(虽然高斯语法上说是支持对分区做analyze)。

暂无图片 评论
暂无图片 有用 0
打赏 0
回答交流
Markdown


请输入正文
提交
相关推荐
postgreSQL 的mvcc怎么实现cache,fusion,维护一个page的所有权表吗?
回答 1
PostgreSQL的MVCC机制是通过维护一个page的所有权表来实现的。当一个事务开始时,它会创建一个新的page,并将该页面的所有行标记为“未锁定”。然后,事务会读取或写入这些行,并将它们标记为
为什么在postgresql数据库中,要规定最新的和最旧的txid不能超过21亿,从无符号2的32次方转为有符号2的31次方?
回答 4
是的,从判断事务ID判断式((int32)(id1id2))<0可知,只要左边是负数,id1就比id2小。因为有int32转换,所以前提是最新的和最旧的txid不能超过21亿,假设事务id没有出
pg中标量子查询长啥样?怎么理解它
回答 1
PG一个标量子查询是一种圆括号内的普通SELECT查询,它刚好返回一行一列。SELECT查询被执行并且该单一返回值被使用在周围的值表达式中。将一个返回超过一行或一列的查询作为一个标量子查询使用是一种错
PG13.10权限问题咨询
回答 4
建议查一下这张表informationschema.tableprivileges,看下用户的权限。
postgresql copy命令可以把服务器上的table数据保存到客户端的文件中吗?
回答 1
不行。
pg中过滤因子的选择,是过滤因子大好还是小好?
回答 2
id的过滤性为0.01,相当于100值个中有1个值符合条件。过滤性更好,所以在id上建索引性能更好。
PostgreSQL数据库 用navicat 打开表结构的时候报错 cannot update secondarysnapshot during a parallel operation 怎么解决?
回答 1
这个参数是设置的是什么?maxparallelworkerspergather非0的话设置为0试试maxparallelworkerspergather0 
12版本下查看主备延迟的3个lag字段都是空,不应该有值吗?
回答 1
没有延迟就没有值。此时主要看lsn那几个字段是否一致即可。可以通过pgbench构造大量压力,产生了延迟,,就可以观察到lag字段有值的情形
pg里这个报错如何解决??
回答 3
pgrman的增量恢复到底是个啥原理?一直没搞明白我如果增量恢复到底是啥步骤呢?、我如果不进行全备恢复,只进行增量恢复,恢复后,表里啥数据都没有,明显不对
华为云裸金属 部署11g RAC,共享盘为一块独立的高性能磁盘,划分三个分区用于ASM(OCR/DATA/FRA),请问是否可行?
回答 1
为什么不弄3块盘呢?如果磁盘不够用的话,我觉得adg也是个不错的选择
问题信息
请登录之后查看
邀请回答
暂无人订阅该标签,敬请期待~~