BUG ?一个小小的UPDATE语句竟然还涉及这么多门路
看腻了就来听听视频演示吧(持续更新中):https://www.bilibili.com/video/BV1DH4y1c7ni/
UPDATE FROM 细节探究
创建测试表和数据:
drop table IF EXISTS test1;
CREATE TABLE test1(id int,name text);
insert into test1 values(1,'PostgreSQL'),(2,'Oracle'),(3,'MySQL');
drop table IF EXISTS test2;
CREATE TABLE test2(id int,name text);
insert into test2 values(5,'TiDB'),(1,'PG'),(2,'OG'),(2,'OG-HA'),(2,'ABCDEFG'),(2,'A'),(2,'abcefg'),(2,'O'),(2,'SY'),(2,'DBA'),(2,'og'),(2,'openGauss'),(4,'Oracle'),(6,'SQLServer');
select * from test1 order by 1;
select ctid,* from test2 order by id,name;
select ctid,* from test2 order by id,ctid;
复制
PostgreSQL系数据库update from关联存在重复数据时只更新首数据,即第一行插入的数据,严格来讲是ctid最小的那一行数据:
看下PG执行计划,可以看到走merge join时是有序的所以更新第一行(ctid最小的那行)数据,关闭merge join后走hash join时则更新最后一行(ctid最大的那行)数据。下面来看一下3个执行计划的执行情况:
merge join:
begin;update test1 t1 set name = t2.name from test2 t2 where t1.id = t2.id returning t1.id,t1.name;rollback;
begin;explain analyze update test1 t1 set name = t2.name from test2 t2 where t1.id = t2.id returning t1.id,t1.name;rollback;
复制
hash join:
关闭enable_mergejoin让优化器偏向于不选择mergejoin
set enable_mergejoin = off;
begin;update test1 t1 set name = t2.name from test2 t2 where t1.id = t2.id returning t1.id,t1.name;rollback;
begin;explain analyze update test1 t1 set name = t2.name from test2 t2 where t1.id = t2.id returning t1.id,t1.name;rollback;
复制
nested loop:
update test2 set name='update-first' where name='OG';
select ctid,* from test2 order by id,ctid;
set enable_hashjoin to off;
begin;update test1 t1 set name = t2.name from test2 t2 where t1.id = t2.id returning t1.id,t1.name;rollback;
begin;explain analyze update test1 t1 set name = t2.name from test2 t2 where t1.id = t2.id returning t1.id,t1.name;rollback;
复制
还原参数设置:
reset enable_mergejoin;
reset enable_hashjoin;
复制
小结一下
- 执行计划不仅会影响执行效率,还会影响执行结果集「 BUG ?」
- update from 关联表存在重复数据时,更新的数据行受执行路径的影响,会选择ctid最小或最大的行做更新操作,具体执行计划和选择ctid大小对应关系如下:
执行路径 | merge join | hash join | nestedloop |
---|---|---|---|
更新ctid值 | min | max | min |
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
执行计划不仅会影响执行效率,还会影响执行结果集「 BUG ?」
6月前

评论
相关阅读
王炸!OGG 23ai 终于支持从PostgreSQL备库抽取数据了
曹海峰
401次阅读
2025-03-09 12:54:06
玩一玩系列——玩玩login_hook(一款即将停止维护的PostgreSQL登录插件)
小满未满、
375次阅读
2025-03-08 18:19:28
明明想执行的SQL是DELETE、UPDATE,但为什么看到的是SELECT(FDW的实现原理解析)
小满未满、
352次阅读
2025-03-19 23:11:26
PostgreSQL初/中/高级认证考试(3.15)通过考生公示
开源软件联盟PostgreSQL分会
304次阅读
2025-03-20 09:50:36
IvorySQL 4.4 发布 - 基于 PostgreSQL 17.4,增强平台支持
通讯员
198次阅读
2025-03-20 15:31:04
套壳论
梧桐
188次阅读
2025-03-09 10:58:17
内蒙古公司成功完成新一代BOSS云原生系统割接上线
openGauss
184次阅读
2025-03-24 09:40:40
命名不规范,事后泪两行
xiongcc
178次阅读
2025-03-13 14:26:08
第4期 openGauss 中级认证OGCP直播班招生中!3月30日开课
墨天轮小教习
149次阅读
2025-03-17 15:48:40
PG vs MySQL 执行计划解读的异同点
进击的CJR
122次阅读
2025-03-21 10:50:08