2022年ACM数据管理国际会议(SIGMOD, ACM SIGMOD International Conference on Management of Data)将于2022年6月12日-17日在美国费城召开。SIGMOD是数据管理领域的最高水平学术会议。IPADS实验室两篇论文被接收,具体信息如下:
- Chuzhe Tang, Zhaoguo Wang, Xiaodong Zhang, Qianmian Yu, Binyu Zang, Haibing Guan, Haibo Chen. Ad Hoc Transactions for Web Applications: The Good, the Bad, and the Ugly. 2022 ACM SIGMOD International Conference on Management of Data (SIGMOD'22)
- Zhaoguo Wang, Zhou Zhou, Yicun Yang, Haoran Ding, Gansen Hu, Ding Ding, Chuzhe Tang, Haibo Chen, Jinyang Li. WeTune: Automatic Discovery and Verification of Query Rewrite Rules. 2022 ACM SIGMOD International Conference on Management of Data (SIGMOD'22)
【论文简介】
Ad Hoc Transactions for Web Applications: The Good, the Bad, and the Ugly
第一篇论文关注面向Web应用的事务机制。在研究过程中,我们发现已有数据库并不能很好满足Web应用的事务性需求,应用开发人员不得不手动实现各种事务机制以支撑应用真实需求。我们称这类事务为即席事务(Ad Hoc Transaction)。目前,人们对即席事务知之甚少。
本工作首次对Web应用中的即席事务进行了全面研究。我们对八个代表不同类型并且Github Star 数目最多的Web应用进行了研究并发现:1)每个应用都会在付款、转账等关键路径上使用即席事务;2)即席事务的灵活性远远高于传统的数据库事务;3)53个即席事务存在安全隐患,其中28个会导致严重后果;4)在高竞争场景下,即席事务表现出色。基于以上研究,我们提出了新型数据库事务抽象,以期在满足Web应用事务性需求的同时,避免即席事务带来的安全隐患。
WeTune: Automatic Discovery and Verification of Query Rewrite Rules
第二篇论文研究面向Web应用的SQL优化方法。已有数据库均基于重写规则(Rewrite Rule)定位应用中有问题的SQL语句并进行改进。这些规则是人们根据经验多年积累而来,对应用性能起着至关重要的作用。但手动制定规则存在一定的局限性,尤其是对于基于框架的Web应用,优化效果并不明显。我们分析了Github中已经确认存在严重性能问题的50条SQL语句,SQL Server仅能优化其中的27条,MYSQL和PostgreSQL的表现就更加让人失望。
本文中提出了WeTune,一种可以自动合成重写规则的规则生成器。通过启发式方法搜索可能的重写规则,并使用一个全新的SQL验证器来保证重写规则的有效性。该验证器将数学中的半环概念与SMT求解器相结合,证明能力远远优于现有已知的SQL验证器。我们使用WeTune对Github上最受欢迎的20个开源应用进行优化,WeTune可以找到并自动改进674条之前未被发现的问题语句,这些语句往往是因为应用开发人员框架接口使用错误导致,相比之下,SQL Server仅能优化其中的427条。
这两项工作是IPADS实验室近年来继DBX [EuroSys’14], drtm [SOSP’15], IC3 [SIGMOD’16], PolyJuice [OSDI’21](事务系统); XIndex [PPoPP’20](数据索引); Paxos2Raft [PODC’19](分布式共识)之后,在数据管理研究领域的进一步探索。其中,WeTune也是继 AtomFS [SOSP’19](文件系统验证)和Paxos2Raft [PODC’19](共识协议验证)之后,在系统与形式化验证技术相结合方向上的又一次成功尝试。