PanWeiDB事务
事务是数据库管理系统执行过程中的一个逻辑单位,由一个有限的数据库操作序列构成。数据库事务通常包含一个序列对数据库的读和写操作,主要是包含以下两个目的:
- 为数据库操作序列提供一个从失败中恢复到正常状态的方法,同时提供了数据库即使在异常状态下保持数据一致性的方法。
- 多个应用程序并发访问数据库时,可以在这些应用程序之间提供一个隔离方法,保证彼此之间操作的操作互不影响。
当事务提交给数据库管理系统,则数据库管理系统需要确保该事务中的所有操作都成功,并且操作会结果被永久保存在数据库中;如果事务中有部分操作失败,则事务中的所有操作都需要回滚,回到事务执行前的状态;同时,该事务对数据库或者其他事务互不影响,所有的事务都是独立运行。
1、事务的属性
- 原子性:一个事务中的所有操作要么全部完成,要么一个都不做,不会在中间某个环节结束。
- 一致性:事务应确保数据库的状态从一个一致状态转变为另一个一致状态,事务执行结束后数据库的完整性没有破坏。
- 隔离性:数据库允许多个并发事物对数据库中的数据进行读写操作,隔离性可以防止多个事务并发执行时导致的数据不一致性。事务根据隔离等级可以分为4级:读未提交、读已提交、可重复度和串行化。
- 持久性:事务执行完成后,对数据的修改是永久的
3、事务的使用
在gsql中默认开启自动提交事务的功能,每提交一条SQL语句,都会被自动提交。可以通过设置AUTOCOMMIT参数来关闭自动提交功能。
postgres=# \dt # 当前存在一张test表
关联列表
架构模式 | 名称 | 型别 | 拥有者 | 存储
----------+------+------+--------+------------------------------------------------
public | test | 表 | omm | {orientation=row,compression=no,fillfactor=80}
(1 行记录)
postgres=# \set AUTOCOMMIT off # 设置AUTOCOMMIT参数关闭
postgres=# \echo :AUTOCOMMIT
off
postgres=# drop table test; # 删除test表
DROP TABLE
postgres=# \dt # 查看是否存在表
找不到关联。
postgres=# rollback ; # 手动回滚事务
ROLLBACK
postgres=# \dt # test表恢复到初始状态
关联列表
架构模式 | 名称 | 型别 | 拥有者 | 存储
----------+------+------+--------+------------------------------------------------
public | test | 表 | omm | {orientation=row,compression=no,fillfactor=80}
(1 行记录)
此外还可以通过begin关键字开启事务,通过commit提交事务,还可以通过rollback进行回滚。
这里引入两个关键字begin和start transaction,两者作用是一样的,但是在使用过程中begin可能会成为关键字的时候,采用start transaction可以避免这种情况发生。
postgres=# select count(*) from test; # 查询数据条目
count
-------
0
(1 行记录)
postgres=# begin; # 启动一个事务
WARNING: there is already a transaction in progress
BEGIN
postgres=# insert into test values(1); # 插入一条数据
INSERT 0 1
postgres=# select count(*) from test; # 查询数据条目
count
-------
1
(1 行记录)
postgres=# rollback ; # 进行事务回滚
ROLLBACK
postgres=# select count(*) from test; # 查询数据条目
count
-------
0
(1 行记录)
PaWeiDB支持保存点的功能,在一个大的事务中,可以把操作过程分为几个部分,每个部分执行成功后可以建一个保存点,若后边的部分执行失败,则会回滚到次保存点,无需回滚整个事务。
postgres=# select count(*) from test; # 初始表数据条数为空
count
-------
0
(1 行记录)
postgres=# begin ; # 开启事务
WARNING: there is already a transaction in progress
BEGIN
postgres=# insert into test values(1); # 插入一条数据
INSERT 0 1
postgres=# savepoint test_point_1; # 建立一个保存点test_point_1
SAVEPOINT
postgres=# insert into test values(2);
INSERT 0 1
postgres=# insert into test values(1); # 由于唯一约束导致插入数据失败
ERROR: duplicate key value violates unique constraint "test_pkey"
描述: Key (id)=(1) already exists.
postgres=# rollback to savepoint test_point_1; # 将事务回滚到test_point_1
ROLLBACK
postgres=# commit ;
COMMIT
postgres=# select count(*) from test; # 此时回滚到保存点test_point_1处,数据条目为一条
count
-------
1
(1 行记录)
4、事务的隔离级别
| 隔离级别 | 描述 |
|---|---|
| 读未提交 | 允许事务读取其他事务没有提交的数据,脏读、不可重复读和幻读都会出现 |
| 读已提交 | 只允许事务读取其他事务已经提交的数据,可以避免脏读,但是不可重复读和幻读都会出现 |
| 可重复读 | 可以保证从一个字段中读取相同的数据,可以任务事务开启时会自动对现有数据进行快照,其他事务修改不管是否提交,当前事务读取的时候快照数据,可以避免脏读和不可重复读,但是幻读问题会出现。 |
| 串行化 | 确保事务是串行执行,可以避免所有的并发问题,但是并发效率低,一般不推荐使用 |
读已提交是PanWeiDB中默认隔离级别。当一个事务处于这个隔离级别是,查询语句只能看到查询开始之前已经提交的数据,无法看到未提交或者查询执行期间其他事务已提交的数据。不过select可以查询自身所在事务中前面尚未提交的操作结果,实际上,select查询看到的是在查询开始运行瞬间的一个快照。
postgres=# begin;
WARNING: there is already a transaction in progress
BEGIN
postgres=# insert into test values(2);
INSERT 0 1
postgres=# select * from test; # 查询到当前事务未提交的数据
id
----
1
2
(2 行记录)
postgres=# rollback ;
ROLLBACK
5、两阶段提交
PanWeiDB数据库支持两阶段提交协议。在分布式系统中,事务包含多台数据库操作,虽然单台数据库可以保证原子性,但是多台数据库之间需要通过两阶段提交来实现。二阶段提交,通过引入一个事务的协调者来管理各个数据库事务的提交和回滚,就是将事务提交分为准备和提交阶段。
具体流程如下:
- 准备阶段:协调者会给各个参与者发送准备命令。等待所有资源响应之后进入第二阶段。
- 提交阶段:若第一阶段所有参与者都返回准备成功后, 协调者再次向所有参与者发送提交事务的命令,然后等待所有事务都提交成功后,返回事务执行成功。

postgres=# select count (*) from test; # 查询当前表数据条目
count
-------
2
(1 行记录)
postgres=# begin; # 开启事务
WARNING: there is already a transaction in progress
BEGIN
postgres=# insert into test values(3); # 插入数据
INSERT 0 1
postgres=# prepare transaction 'test_transaction'; # 使用prepare transaction提交事务(第一阶段)
PREPARE TRANSACTION
postgres=# select count (*) from test; # 查询当前表数据条目
count
-------
2
(1 行记录)
postgres=# \q
[omm@test panweidb]$ gs_ctl stop && gs_ctl start # 重启数据库
[omm@test panweidb]$ gsql -r
gsql ((PanWeiDB 2.0.0 (Build0)) compiled at 2024-01-05 17:19:18 commit 9fbca90 last mr )
非SSL连接(安全性要求高时,建议使用SSL连接)
输入 "help" 来获取帮助信息。
postgres=#
postgres=# select count (*) from test; # 查询当前表数据条目
count
-------
2
(1 行记录)
postgres=# commit prepared 'test_transaction'; # 提交二阶段事务
COMMIT PREPARED
postgres=# select count (*) from test; # 查询当前表数据条目,事务被提交,可以查询到插入数据
count
-------
3
(1 行记录)
test_transaction是作为两阶段提交中全局事务ID,由事务协调器生成,一旦执行一阶段提交事务,则会把事务持久化,即使数据库重启也不会影响事务的回滚。
两阶段提交是一种尽量保证强一致性的分布式事务,因此它是同步阻塞的,而同步阻塞就导致长久的资源锁定问题,总体而言效率低,并且存在单点故障问题,在极端条件下会存在数据不一致的风险。




