作者:杨涛涛
资深数据库专家,专研 MySQL 十余年。擅长 MySQL、PostgreSQL、MongoDB 等开源数据库相关的备份恢复、SQL 调优、监控运维、高可用架构设计等。目前任职于爱可生,为各大运营商及银行金融企业提供 MySQL 相关技术支持、MySQL 相关课程培训等工作。
本文来源:原创投稿
* 爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。
first_value:用来返回一个分组窗口里的第一行记录,也即排名第一的那行记录。
我们用表 t1 来示范,这张表里只有12行记录,其中每6行记录按照字段 r1 来分组。
localhost:ytt_new>select id,r1,r2 from t1; +----+------+------+ | id | r1 | r2 | +----+------+------+ | 1 | 10 | 20 | | 2 | 10 | 30 | | 3 | 10 | 40 | | 4 | 10 | 50 | | 5 | 10 | 2 | | 6 | 10 | 3 | | 7 | 11 | 100 | | 8 | 11 | 101 | | 9 | 11 | 1 | | 10 | 11 | 3 | | 11 | 11 | 10 | | 12 | 11 | 20 | +----+------+------+ 12 rows in set (0.00 sec)
复制
比如想拿到每个分组里的第一名(升序),可以用row_number()函数,我们来回顾下:
localhost:ytt_new>select r1,r2 from (select r1,r2,row_number() over(partition by r1 order by r2) as rn from t1) T where T.rn = 1; +------+------+ | r1 | r2 | +------+------+ | 10 | 2 | | 11 | 1 | +------+------+ 2 rows in set (0.00 sec)
复制
此时如果用 first_value 来实现,写法会更加简单:
localhost:ytt_new>select distinct r1,first_value(r2) over(partition by r1 order by r2) as first_r2 from t1; +------+----------+ | r1 | first_r2 | +------+----------+ | 10 | 2 | | 11 | 1 | +------+----------+ 2 rows in set (0.00 sec)
复制
last_value:和first_value相反,用来返回分组窗口里的最后一行记录,也即倒数第一的那行记录。
localhost:ytt_new>select distinct r1,last_value(r2) over(partition by r1 order by r2) 'last_r2' from t1; +------+---------+ | r1 | last_r2 | +------+---------+ | 10 | 2 | | 10 | 3 | | 10 | 20 | | 10 | 30 | | 10 | 40 | | 10 | 50 | | 11 | 1 | | 11 | 3 | | 11 | 10 | | 11 | 20 | | 11 | 100 | | 11 | 101 | +------+---------+ 12 rows in set (0.01 sec)
复制
那正确的框架应该是什么样呢?正确的框架应该是让边界锁定整个分组的上下边缘,也即整个分组的上限与下限之间。所以正确的写法如下:
localhost:ytt_new>select distinct r1,last_value(r2) over(partition by r1 order by r2 RANGE BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) as 'last_r2' from t1; +------+---------+ | r1 | last_r2 | +------+---------+ | 10 | 50 | | 11 | 101 | +------+---------+ 2 rows in set (0.00 sec)
复制
nth_value:用来返回分组内指定行的记录。
localhost:ytt_new>select * from (select distinct r1,nth_value(r2,1) over(partition by r1 order by r2) 'first_r2' from t1) T where T.first_r2 is not null; +------+----------+ | r1 | first_r2 | +------+----------+ | 10 | 2 | | 11 | 1 | +------+----------+ 2 rows in set (0.00 sec)
复制
ntile:用来在分组内继续二次分组。
比如我想取出分组内排名前 50% 的记录,可以这样写:
localhost:ytt_new>select id,r1,r2 from (select id,r1,r2, ntile(2) over(partition by r1 order by r2) 'ntile ' from t1) T where T.ntile=1; +----+------+------+ | id | r1 | r2 | +----+------+------+ | 5 | 10 | 2 | | 6 | 10 | 3 |
| 1 | 10 | 20 |
| 9 | 11 | 1 |
| 10 | 11 | 3 |
| 11 | 11 | 10 |
+----+------+------+
6 rows in set (0.00 sec)复制
本文关键字:#MySQL 8.0# #窗口函数#


文章转载自爱可生开源社区,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
相关阅读
墨天轮个人数说知识点合集
JiekeXu
411次阅读
2025-04-01 15:56:03
MySQL数据库当前和历史事务分析
听见风的声音
410次阅读
2025-04-01 08:47:17
MySQL 生产实践-Update 二级索引导致的性能问题排查
chengang
370次阅读
2025-03-28 16:28:31
MySQL 9.3 正式 GA,我却大失所望,新特性亮点与隐忧并存?
JiekeXu
327次阅读
2025-04-15 23:49:58
3月“墨力原创作者计划”获奖名单公布
墨天轮编辑部
320次阅读
2025-04-15 14:48:05
【活动】分享你的压箱底干货文档,三篇解锁进阶奖励!
墨天轮编辑部
313次阅读
2025-04-17 17:02:24
云和恩墨杨明翰:安全生产系列之MySQL高危操作
墨天轮编辑部
293次阅读
2025-03-27 16:45:26
openHalo问世,全球首款基于PostgreSQL兼容MySQL协议的国产开源数据库
严少安
271次阅读
2025-04-07 12:14:29
记录MySQL数据库的一些奇怪的迁移需求!
陈举超
177次阅读
2025-04-15 15:27:53
[MYSQL] 服务器出现大量的TIME_WAIT, 每天凌晨就清零了
大大刺猬
172次阅读
2025-04-01 16:20:44