暂无图片
暂无图片
1
暂无图片
暂无图片
暂无图片

从Oracle到PostgreSQL:Undo 原理 和 MVCC 的实现差异

原创 eygle 2020-10-29
3061

Oracle DBA在接触 PostgreSQL 时,会注意到两者一个巨大的不同,那就是在 PostgreSQL数据库中,不存在 Undo 表空间。这从根本上代表了,两者在实现 MVCC 上的差异。

MVCC(Multi-Version Concurrency Control),即多版本并发控制。在早期的数据库实现中,一行记录上主要用两种锁来控制并发,就是读锁和写锁,读写互斥。这对于数据库的并发带来了巨大的影响。MVCC 的提出就是为了解决并发控制问题,使得读写可以同时进行,不再互斥。

MVCC 的实现通常有两种方法,在写入新数据时:

  1. 写入新数据时,把原数据转移到一个单独的地方,如Undo段中,其他用户读数据时,会通过 UNDO 构造出原数据,提供读一致性,这就是Oracle的实现方式;
  2. 写入新数据时,原有数据不变更,而是把新数据插入,在旧版本的原有数据不需要时,垃圾回收器将回收这些过期的数据,这就是 PostgreSQL 的实现。

具体一点来说:

  1. 在 PostgreSQL 中执行DELETE时, 行不会立即从数据文件中删除, 而是在页头设置xmax字段将其标记为已删除;
  2. 对于 PostgreSQL 的 于UPDATE, 在PG中可以被视为DELETE + INSERT,标记原记录删除,插入新的记录;

PostgreSQL 的 MVCC 实现的好处是,回滚特别快,因为不需要做复杂的回退,不存在回滚段的竞争,因此数据库理论上可以支持更高的、更大规模的并发操作。但是由于元组的不断保留,可能导致空间使用率的膨胀,并且需要定期进行清理。

PostgreSQL 的 MVCC 原理图如下所示:
image.png

Oracle MVCC 的优势在于,UNDO 数据是独立的,不会导致空间膨胀,但是对于大量事务并发时,可能带来回滚段的竞争,大事务回滚时,会导致数据库表的长时间锁定。但是经过很多版本的迭代,Oracle 的UNDO已经能够非常好的应对实践应用了。

Oracle 的 MVCC 实现原理如下图所示:
PIC.jpg

供参考。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论