暂无图片
pg中除了基本统计信息,如何收集数据的分布信息--数据不均匀?
我来答
分享
暂无图片 匿名用户
pg中除了基本统计信息,如何收集数据的分布信息--数据不均匀?

pg中除了基本统计信息---假设数据是均匀分布的,当表中的数据不均匀,这个时候需要收集数据的分布情况,来


给优化器做正确的判断用

我来答
添加附件
收藏
分享
问题补充
2条回答
默认
最新
shunwahⓂ️

pg出现了数据分布不均衡的时候,我们可以选择人工干预,通过调整pg分布来 达到数据(大致)均衡。

2.1设置集群仅支持 Luminous(或者L之后的)客户端
具体命令:

#ceph osd set-require-min-compat-client luminous

#ceph osd set-require-min-compat-client luminous --yes-i-really-mean-it

2.2获取集群当前的osdmap信息
命令
ceph osd getmap {osdmap_filename}

2.3获取当前集群数据均衡后的优化信息
命令
osdmaptool {osdmap_filename} --upmap out.txt [–upmap-pool ] [–upmap-max ] [–upmap-deviation ]
其中

upmap-pool :指定需要优化均衡的存储池名

upmap-max: 指定一次优化的数据条目,默认100,可根据环境业务情况调整该值,一次调整的条目越多,数据迁移会越多,可能对环境业务造成影响。

max-deviation:最大偏差值,默认为0.01(即1%)。如果OSD利用率与平均值之间的差异小于此值,则将被视为完美。

2.4均衡
运行数据分布调整操作,这一步将会使集群开始进行PG重新映射,同时集群数据开始迁移均衡
命令:source out.txt

等到数据迁移完成后,再来观察数据的使用率,发现osd的使用率大都均衡在83%左右,较调整前,更均衡。
https://blog.csdn.net/a13568hki/article/details/113787518

暂无图片 评论
暂无图片 有用 0
打赏 0
手机用户9375
2022-11-09
你这是greenplum数仓的?
张sir

通过analyze命令收集统计信息会自动更新列分布信息,应对数据分布不均匀的情况。

暂无图片 评论
暂无图片 有用 1
打赏 0
回答交流
Markdown


请输入正文
提交
相关推荐
PCP和PGCE这两个证哪个含金量更高一些更值得考?
回答 2
这是两个认证体系,还是建议自行考虑
PG:在列上创建索引后,仍使用顺序扫描,怎么才能绕过?
回答 1
已采纳
要看表结构和索引的列的区分度。如果区分度较好。比如你是唯一的,那么不会出现你说的情况。所以要看实际情况。
哪里有测试库中表emp ,dept ,salgrade的测试数据和表结构?
回答 4
学习了
PostgreSQL delete 一张表后,磁盘没有减少怎么办?
回答 4
涨姿势了
循环日志下,pg遇到超大事务
回答 1
强烈建议,分开多个做。
如何通过postgresql元表来查找表的索引是降序的?
回答 1
selectfrompgindexes;indexdef列可以看到valueDESC
有没有好的工具可以监听postgresql接收到了哪些查询请求?
回答 1
如果这样的需求的话,您需要的是数据库审计。旁路接入,全部记录的那种。
在PG中,repmgr能否实现:当standby落后于primary时,或者落后多少多少时,主库出现故障,不会进行autofailover
回答 1
repmgr确实可以实现这种功能。这是通过配置复制延迟检查来实现的。以下是具体的实现方法:1.复制延迟检查repmgr提供了一个名为replicationlagcritical的参数。当备库的复制延迟
postgresql 数据源是access的mdb文件,怎么高效转换导入postgresql数据库?用c#+oledb?
回答 1
已采纳
通过Navicat的导入向导,直接就能将access的mdb导入至pg中了。
postgreSQL 存储过程需要反编译吗?
回答 1
不需要反编译PostgreSQL对存储过程:存储过程和用户自定义函数(UDF)是SQL和过程语句的集合,它存储于数据库服务器并能被SQL接口调用。总结下来存储过程有如下特性:存储于数据库服务器一次编译