暂无图片
暂无图片
暂无图片
暂无图片
1
暂无图片

PostgreSQL锁介绍第2部分:重量级锁

飞象数据 2019-01-18
804

对应用程序开发者和DBA来说PostgreSQL可见性锁在大部分场景下都与重量级锁相关。数据库复杂的锁操作需要使用系统视图来进行完全检测,因此应该清楚哪些对象被特定的数据库后端进程给锁定了。锁的别称是‘瓶颈’。为了使数据库操作并行,我们应该将单个’瓶颈‘分割成多个特定操作的任务。

这是发表的三篇与表锁相关的博客中的第二部分。前一篇博客是关于行锁,随后的下一篇博客会回顾保护内部数据库结构的latches。

1、  示例环境

创建一个包含两行的单列表

  1. CREATE TABLE locktest (c INT);

  2. INSERT INTO locktest VALUES (1), (2);

复制

2、  辅助视图

为了检查这些不同类型的锁,我们需要创建一个辅助视图。

  1. CREATE VIEW lockview AS SELECT pid, virtualtransaction AS vxid, locktype AS lock_type,

  2. mode AS lock_mode, granted,

  3. CASE

  4. WHEN virtualxid IS NOT NULL AND transactionid IS NOT NULL

  5. THEN virtualxid || ' ' || transactionid

  6. WHEN virtualxid::text IS NOT NULL

  7. THEN virtualxid

  8. ELSE transactionid::text                                                                                                                                                                                           END AS xid_lock, relname,

  9. page, tuple, classid, objid, objsubid

  10. FROM pg_locks LEFT OUTER JOIN pg_class ON (pg_locks.relation = pg_class.oid)

  11. WHERE -- do not show our views locks

  12. pid != pg_backend_pid() AND

  13. -- no need to show self-vxid locks                                                                                                                                                                                 virtualtransaction IS DISTINCT FROM virtualxid

  14. -- granted is ordered earlier

  15. ORDER BY 1, 2, 5 DESC, 6, 3, 4, 7;

复制

3、  行级共享锁

许多应用程序使用read-modify-write 范例。例如,应用程序从表里取到一个单独的对象属性,修改它,然后把更改回写到数据库。在多用户环境下,不同的用户能够在一个事务执行的过程中去修改同一行记录,此时我们使用简单查询会得到不一致的数据。为了响应用户需求,几乎所有的SQL数据库都有select ... for share 锁,这个特性能阻止应用端去修改数据直到持有锁用户的事务提交或者回滚。

例如:

  1. 在一个账户表里有存储多个银行账户,在银行客户端表里存储总资产的用户

  2. 为了更新总资产,我们需要阻止所有与这个特定银行客户端相关的行的修改

  3. 使用单独的更新语句去计算总资产然后从账户表里查询它会更好。如果更新需要外部数据,或者一些用户操作,那么需要多条语句。

  1. START TRANSACTION;

  2. SELECT * FROM accounts WHERE clientid = 55 FOR SHARE;

  3. SELECT * FROM bankclients WHERE clientid=55 FOR UPDATE;

  4. UPDATE bankclients SET totalamount=38984.33, clientstatus='gold' WHERE client_id=55;

  5. COMMIT;

复制

select for share语句在locktest表上创建了行级共享锁。

这里使用了一条SQL语句创建了同样的锁。

  1. BEGIN;

  2. LOCK TABLE locktest IN ROW SHARE MODE;

复制

不管查询会锁定多少行记录,它都需要一个重量级的行级共享锁。

下面的例子展示了一个未完成的事务。先开启一个未提交的事务,然后在新的数据库连接上查询lockview 

  1. BEGIN;

  2. SELECT * FROM locktest FOR SHARE;

  3. -- In second connection:

  4. postgres=# SELECT pid,vxid,lock_type,lock_mode,granted,xid_lock,relname FROM lockview;

  5.  pid  | vxid |   lock_type   |   lock_mode   | granted | xid_lock | relname

  6. -------+------+---------------+---------------+---------+----------+----------

  7. 21144 | 3/13 | transactionid | ExclusiveLock | t       | 586      |

  8. 21144 | 3/13 | relation      | RowShareLock  | t       |          | locktest

复制

4、  行级排他锁

对行进行修改的实际查询也需要在每张表上添加一个重量级锁。

接下来的例子使用了一个delete查询,但即使是update也会产生同样的效果。

所有去修改表数据的命令都会去申请一个行级排他锁。

  1. BEGIN;

  2. DELETE FROM locktest;

  3. -- second connection

  4. postgres=# SELECT pid,vxid,lock_type,lock_mode,granted,xid_lock,relname FROM lockview;

  5.  pid  | vxid |   lock_type   |    lock_mode     | granted | xid_lock | relname

  6. -------+------+---------------+------------------+---------+----------+----------

  7. 10997 | 3/6  | transactionid | ExclusiveLock    | t       | 589      |

  8. 10997 | 3/6  | relation      | RowExclusiveLock | t       |          | locktest

复制

这种新锁和前面例子里提到的行级共享锁for share是不兼容的,select * from locktest for share语句会等待delete事务的结束或者异常退出。

  1. postgres=# SELECT pid,vxid,lock_type,lock_mode,granted,xid_lock,relname,page,tuple FROM lockview;

  2.  pid  | vxid |   lock_type   |    lock_mode     | granted | xid_lock | relname  | page | tuple

  3. -------+------+---------------+------------------+---------+----------+----------+------+-------

  4. 10997 | 3/6  | transactionid | ExclusiveLock    | t       | 589      |          |      |

  5. 10997 | 3/6  | relation      | RowExclusiveLock | t       |          | locktest |      |

  6. 11495 | 5/9  | relation      | RowShareLock     | t       |          | locktest |      |

  7. 11495 | 5/9  | tuple         | RowShareLock     | t       |          | locktest |    0 |     1

  8. 11495 | 5/9  | transactionid | ShareLock        | f       | 589      |          |      |

复制

修改表数据的查询同时还锁住了所有的索引,即使这个索引不包含被修改的字段。

  1. -- preparation

  2. CREATE INDEX c_idx2 ON locktest (c);

  3. ALTER TABLE locktest ADD COLUMN c2 INT;

  4. CREATE INDEX c2_idx ON locktest(c2);

  5. -- unfinished example transaction

  6. BEGIN;

  7. UPDATE locktest SET c=3 WHERE c=1;

  8. -- second connection

  9. postgres=# SELECT * FROM lockview;

  10. pid  |  vxid  | lock_type  |    lock_mode     | granted | xid_lock | relname  | page | tuple | classid | objid | objsubid

  11. ------+--------+------------+------------------+---------+----------+----------+------+-------+---------+-------+----------

  12. 3998 | 3/7844 | virtualxid | ExclusiveLock    | t       | 3/7844   |          |      |       |         |       |

  13. 3998 | 3/7844 | relation   | RowExclusiveLock | t       |          | c2_idx   |      |       |         |       |

  14. 3998 | 3/7844 | relation   | RowExclusiveLock | t       |          | c_idx    |      |       |         |       |

  15. 3998 | 3/7844 | relation   | RowExclusiveLock | t       |          | c_idx2   |      |       |         |       |

  16. 3998 | 3/7844 | relation   | RowExclusiveLock | t       |          | locktest |      |       |         |       |

复制

5、  共享锁

create index的non-concurrent版本使用共享锁阻止了表的一些更新操作,例如drop table或者insert或者delete

  1. BEGIN;

  2. CREATE INDEX c_idx ON locktest (c);

  3. -- second connection

  4. postgres=# SELECT * FROM lockview;

  5. pid  |  vxid  |   lock_type   |      lock_mode      | granted | xid_lock | relname  | page | tuple | classid | objid | objsubid

  6. ------+--------+---------------+---------------------+---------+----------+----------+------+-------+---------+-------+----------

  7. 3998 | 3/7835 | virtualxid    | ExclusiveLock       | t       | 3/7835   |          |      |       |         |       |

  8. 3998 | 3/7835 | transactionid | ExclusiveLock       | t       | 564      |          |      |       |         |       |

  9. 3998 | 3/7835 | relation      | AccessExclusiveLock | t       |          |          |      |       |         |       |

  10. 3998 | 3/7835 | relation      | ShareLock           | t       |          | locktest |      |       |         |       |

复制

你可以并行的执行多条create index查询除非索引名字重复,在pg_class表的行锁上(transactionid 类型的共享锁)发生锁等待。

注意有一个relation类型的访问排他锁,但它并不是一个表级别的锁。

6、  共享更新排他锁

下列数据库维护操作需要持有共享更新排他锁:

  1.   ANALYZE table

  2.   VACUUM (without full) runs

  3.   CREATE INDEX CONCURRENTLY

复制

ANALYZE tablename语句更新表的统计信息,只有当统计信息是实时的查询计划器和查询优化器才能提供最优的执行计划给查询执行器。

  1. BEGIN;

  2. ANALYZE locktest;

  3. -- in second connection

  4. postgres=# SELECT pid,vxid,lock_type,lock_mode,granted,xid_lock,relname FROM lockview;

  5.  pid  | vxid |   lock_type   |        lock_mode         | granted | xid_lock | relname

  6. -------+------+---------------+--------------------------+---------+----------+----------

  7. 10997 | 3/7  | transactionid | ExclusiveLock            | t       | 591      |

  8. 10997 | 3/7  | relation      | ShareUpdateExclusiveLock | t       |          | locktest


复制

行级排他锁和共享更新排他锁是没有冲突的,在执行`ANALYZE`操作期间`UPDATE/DELETE/INSERT` 操作仍然可以修改行记录。

`VACUUM 和 CREATE INDEX CONCURRENTLY`在一个事务外可以被执行。为了在`lockview ` 视图看这些语句的影响,首先执行一个冲突的事务,例如,在一个事务中运行`ANALYZE`,或者对一个大表执行`VACUUM` .

`CREATE INDEX CONCURRENTLY`锁操作可能有点令人困惑。共享更新排他锁与被用于`DELETE,INSERT和UPDATE` 操作的行级排他锁不会冲突。遗憾的是,`CREATE INDEX CONCURRENTLY`操作会等待直到活动的事务结束由于两次全表扫描。

“在并发索引构建中,索引实际上在一个事务中被录入到系统目录, 然后在两个或更多事务中发生两次表扫描。在每一次表扫描之前, 索引构建必须等待已经修改了表的现有事务终止。”

7、  访问排他锁

此锁与被用于以下操作的其他锁冲突

  1.    CREATE RULE

  2.    DROP TABLE

  3.    DROP INDEX

  4.    TRUNCATE

  5.    VACUUM FULL

  6.    LOCK TABLE(default mode)

  7.    CLUSTER

  8.    REINDEX

  9.    REFRESH MATERIALIZED VIEW(without CONCURRENTLY)

  10. BEGIN;

  11. CREATE RULE r_locktest AS ON INSERT TO locktest DO INSTEAD NOTHING;

  12. -- second connection

  13. postgres=# select pid,vxid,lock_type,lock_mode,granted,xid_lock,relname from lockview;

  14.  pid  | vxid |   lock_type   |      lock_mode      | granted | xid_lock | relname

  15. -------+------+---------------+---------------------+---------+----------+----------

  16. 10997 | 3/19 | transactionid | ExclusiveLock       | t       | 596      |

  17. 10997 | 3/19 | relation      | AccessExclusiveLock | t       |          | locktest

复制

更重要的是,删除索引时需要持有表和索引上的访问排他锁:

  1. BEGIN;

  2. DROP INDEX c_idx;

  3. -- second connection

  4. postgres=# SELECT * FROM lockview;

  5. pid  |  vxid  |   lock_type   |      lock_mode      | granted | xid_lock | relname  | page | tuple | classid | objid | objsubid

  6. ------+--------+---------------+---------------------+---------+----------+----------+------+-------+---------+-------+----------

  7. 3998 | 3/7839 | virtualxid    | ExclusiveLock       | t       | 3/7839   |          |      |       |         |       |

  8. 3998 | 3/7839 | transactionid | ExclusiveLock       | t       | 569      |          |      |       |         |       |

  9. 3998 | 3/7839 | relation      | AccessExclusiveLock | t       |          | c_idx    |      |       |         |       |

  10. 3998 | 3/7839 | relation      | AccessExclusiveLock | t       |          | locktest |      |       |         |       |

复制

注意:这是最危险的一种锁,避免在生产中运行需要访问排他锁的查询,或者至少将应用至于维护模式。

8、  排他锁

  1. 同时, SQL命令不使用排他锁,除了 通用的`LOCK TABLE` 语句。这种锁会阻止所有的请求除了不需要加锁的 `SELECT`操作( 即没有`FOR SHARE/UPDATE`)  

  2. BEGIN;

  3. LOCK TABLE locktest IN EXCLUSIVE MODE;

  4. -- second connection

  5. postgres=# SELECT pid,vxid,lock_type,lock_mode,granted,xid_lock,relname FROM lockview;

  6.  pid  | vxid | lock_type |   lock_mode   | granted | xid_lock | relname

  7. -------+------+-----------+---------------+---------+----------+----------

  8. 10997 | 3/21 | relation  | ExclusiveLock | t       |          | locktest

复制

9、  保存点

  1. 保存点产生一个额外的具有新xid值的`transactionid` 类型的排他锁。

  2. BEGIN;

  3. SELECT * FROM locktest FOR SHARE;

  4. SAVEPOINT s1;

  5. SELECT * FROM locktest FOR UPDATE;

  6. -- second connection

  7. postgres=# SELECT pid,vxid,lock_type,lock_mode,granted,xid_lock,relname FROM lockview;

  8.  pid  | vxid |   lock_type   |    lock_mode    | granted | xid_lock | relname

  9. -------+------+---------------+-----------------+---------+----------+----------

  10. 10997 | 3/37 | transactionid | ExclusiveLock   | t       | 602      |

  11. 10997 | 3/37 | transactionid | ExclusiveLock   | t       | 603      |

  12. 10997 | 3/37 | relation      | AccessShareLock | t       |          | c_idx

  13. 10997 | 3/37 | relation      | RowShareLock    | t       |          | locktest

复制

10、  咨询锁

有时候应用开发人员会需要在进程间同步通信。在这类系统上,应用会频繁的创建和删除锁,基于行锁的系统实现往往会导致表膨胀的问题。

有许多和咨询锁相关的功能:

  •  每个会话或者每个事务

  • 阻塞锁或者非阻塞锁

  •  排他或者共享

  • 64位或者两个32位整型资源标识符

  1. 假设我们有几个定时作业,应用程序应该阻止同一个脚本的同时运行。接下来,每个脚本可以检查PostgreSQL中用于特定的整型作业标识符的锁是否可用。

  2. postgres=# SELECT pg_try_advisory_lock(10);

  3. pg_try_advisory_lock

  4. ----------------------

  5. t

  6. -- second connection

  7. postgres=# SELECT * FROM lockview;

  8. pid  | vxid | lock_type |   lock_mode   | granted | xid_lock | relname | page | tuple | classid | objid | objsubid

  9. ------+------+-----------+---------------+---------+----------+---------+------+-------+---------+-------+----------

  10. 3998 | 3/0  | advisory  | ExclusiveLock | t       |          |         |      |       |       0 |    10 |        1

  11. -- other connections

  12. SELECT pg_try_advisory_lock(10);

  13. pg_try_advisory_lock

  14. ----------------------

  15. f

复制

咨询锁类型的查询产生了排他锁。

11、  死锁

当查询永不结束的时候,具有多种类型锁的系统往往会出现死锁的场景。解决这类问题的唯一方法是杀掉阻塞的查询语句。更重要的是,在PostgreSQL中死锁检测是一个开销很大的操作。死锁的检查只会发生在一个事务被阻塞了deadlock_timeout微秒后-默认是1秒钟后。

这里是一个由两个不同的连接A和B引起死锁场景的例子:

任何的死锁都始于锁阻塞。

  1. A: BEGIN; SELECT c FROM locktest WHERE c=1 FOR UPDATE;

  2. B: BEGIN; SELECT c FROM locktest WHERE c=2 FOR UPDATE; SELECT c FROM locktest WHERE c=1 FOR UPDATE;

复制

识别死锁不只靠你自己,因为pg_stat_activity系统视图可以帮助你找到导致锁等待的语句和事务。

  1. postgres=# SELECT pg_stat_activity.pid AS pid,

  2. query, wait_event, vxid, lock_type,

  3. lock_mode, granted, xid_lock

  4. FROM lockview JOIN pg_stat_activity ON (lockview.pid = pg_stat_activity.pid);

  5.  pid  |          query             |  wait_event   | vxid |   lock_type   |      lock_mode      | granted | xid_lock

  6. -------+----------------------------+---------------+------+---------------+---------------------+---------+----------

  7. 10997 | SELECT ... c=1 FOR UPDATE; | ClientRead    | 3/43 | transactionid | ExclusiveLock       | t       | 605

  8. 10997 | SELECT ... c=1 FOR UPDATE; | ClientRead    | 3/43 | advisory      | ExclusiveLock       | t       |

  9. 10997 | SELECT ... c=1 FOR UPDATE; | ClientRead    | 3/43 | relation      | AccessShareLock     | t       |

  10. 10997 | SELECT ... c=1 FOR UPDATE; | ClientRead    | 3/43 | relation      | RowShareLock        | t       |

  11. 11495 | SELECT ... c=1 FOR UPDATE; | transactionid | 5/29 | transactionid | ExclusiveLock       | t       | 606

  12. 11495 | SELECT ... c=1 FOR UPDATE; | transactionid | 5/29 | advisory      | ExclusiveLock       | t       |

  13. 11495 | SELECT ... c=1 FOR UPDATE; | transactionid | 5/29 | relation      | AccessShareLock     | t       |

  14. 11495 | SELECT ... c=1 FOR UPDATE; | transactionid | 5/29 | relation      | RowShareLock        | t       |

  15. 11495 | SELECT ... c=1 FOR UPDATE; | transactionid | 5/29 | tuple         | AccessExclusiveLock | t       |

  16. 11495 | SELECT ... c=1 FOR UPDATE; | transactionid | 5/29 | transactionid | ShareLock           | f       | 605

复制

SELECT FOR UPDATE on c=2 语句导致死锁:

  1. SELECT c FROM locktest WHERE c=2 FOR UPDATE;

复制

在此之后,PostgreSQL 在数据库日志中报出:

  1. 2018-08-02 08:46:07.793 UTC [10997] ERROR:  deadlock detected

  2. 2018-08-02 08:46:07.793 UTC [10997] DETAIL:  Process 10997 waits for ShareLock on transaction 606; blocked by process 11495.

  3. Process 11495 waits for ShareLock on transaction 605; blocked by process 10997.

  4. Process 10997: select c from locktest where c=2 for update;

  5. Process 11495: select c from locktest where c=1 for update;

  6. 2018-08-02 08:46:07.793 UTC [10997] HINT:  See server log for query details.

  7. 2018-08-02 08:46:07.793 UTC [10997] CONTEXT:  while locking tuple (0,3) in relation "locktest"

  8. 2018-08-02 08:46:07.793 UTC [10997] STATEMENT:  SELECT c FROM locktest WHERE c=2 FOR UPDATE;

  9. ERROR:  deadlock detected

  10. DETAIL:  Process 10997 waits for ShareLock on transaction 606; blocked by process 11495.

  11. Process 11495 waits for ShareLock on transaction 605; blocked by process 10997.

  12. HINT:  See server log for query details.

  13. CONTEXT:  while locking tuple (0,3) in relation "locktest"

复制

正如你所见,数据库服务端自动的中止了一个阻塞的事务。

12、  多事务死锁

正常情况下产生死锁仅仅只需要有两个事务。但是,在复杂的场景下,一个应用可能产生形成了依赖环的多事务死锁。

第一步:

A:锁住第一行,B:锁住第二行 C:锁住第三行

第二步:

A:试图拿到第三行 B:试图拿到第一行 C:试图拿到第二行

13、  总结

  • 不要在长事务中执行DDL语句。

  •  尽量避免在高负载、频繁更新的表上执行DDL 操作。

  • CLUSTER命令需要持有排他锁来访问表和表上的所有索引。

  • 监控PostgreSQL 数据库日志中死锁相关的信息。

14、  原文链接

https://www.percona.com/blog/2018/10/24/postgresql-locking-part-2-heavyweight-locks/

敬请关注飞象数据

文章转载自飞象数据,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

沈宏
暂无图片
2年前
评论
暂无图片 0
文章中的示例都对不上号
2年前
暂无图片 点赞
评论