问题描述
嗨,
我有一个特殊的要求来识别数据组的重复项。所以这里是一个样本数据集。
这些组的PI 1001、1003和1005被认为是重复的,因为这些PI中的每一个具有相同的BU、PR、AC组合。有没有一种简单的方法可以将组标识为重复项。
下面是测试用例设置脚本。
提前感谢您的帮助。
我有一个特殊的要求来识别数据组的重复项。所以这里是一个样本数据集。
PI BU PR AC ---------- ---------- -------------------- ---------- 1001 100 PR1 AC1 1001 100 PR1 AC2 1002 100 PR1 AC1 1003 100 PR1 AC1 1003 100 PR1 AC2 1004 100 PR1 AC2 1005 100 PR1 AC1 1005 100 PR1 AC2
这些组的PI 1001、1003和1005被认为是重复的,因为这些PI中的每一个具有相同的BU、PR、AC组合。有没有一种简单的方法可以将组标识为重复项。
下面是测试用例设置脚本。
CREATE TABLE T ( PI NUMBER, BU NUMBER, PR VARCHAR2(20 BYTE), AC VARCHAR2(10 BYTE) ); Insert into T Values (1001, 100, 'PR1', 'AC1'); Insert into T Values (1001, 100, 'PR1', 'AC2'); Insert into T Values (1002, 100, 'PR1', 'AC1'); Insert into T Values (1003, 100, 'PR1', 'AC1'); Insert into T Values (1003, 100, 'PR1', 'AC2'); Insert into T Values (1004, 100, 'PR1', 'AC2'); Insert into T Values (1005, 100, 'PR1', 'AC1'); Insert into T Values (1005, 100, 'PR1', 'AC2'); COMMIT; SELECT * FROM T;
提前感谢您的帮助。
专家解答
它们在AC列中似乎都有不同的值?为什么它们是重复的?
无论如何,要找到重复项,您需要做的就是:
-按标识重复行的表达式分组
-返回计数> 1的那些
例如:
您可以在以下位置阅读更多查找 (和删除!) 重复项的技术:
https://blogs.oracle.com/sql/how-to-find-and-delete-duplicate-rows-with-sql
无论如何,要找到重复项,您需要做的就是:
-按标识重复行的表达式分组
-返回计数> 1的那些
例如:
SELECT pi, bu, pr, substr(ac, 1, 2) , count(*) FROM T group by pi, bu, pr, substr(ac, 1, 2) having count(*) > 1; PI BU PR SUBSTR(AC,1,2) COUNT(*) 1001 100 PR1 AC 2 1003 100 PR1 AC 2 1005 100 PR1 AC 2
您可以在以下位置阅读更多查找 (和删除!) 重复项的技术:
https://blogs.oracle.com/sql/how-to-find-and-delete-duplicate-rows-with-sql
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。