暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Oracle SQL标识数据组的重复项。

askTom 2017-11-06
200

问题描述

嗨,
我有一个特殊的要求来识别数据组的重复项。所以这里是一个样本数据集。

        PI         BU PR                   AC
---------- ---------- -------------------- ----------
      1001        100 PR1                  AC1
      1001        100 PR1                  AC2
      1002        100 PR1                  AC1
      1003        100 PR1                  AC1
      1003        100 PR1                  AC2
      1004        100 PR1                  AC2
      1005        100 PR1                  AC1
      1005        100 PR1                  AC2


这些组的PI 1001、1003和1005被认为是重复的,因为这些PI中的每一个具有相同的BU、PR、AC组合。有没有一种简单的方法可以将组标识为重复项。

下面是测试用例设置脚本。

CREATE TABLE T
(
  PI     NUMBER,
  BU     NUMBER,
  PR   VARCHAR2(20 BYTE),
  AC  VARCHAR2(10 BYTE)
);

Insert into T Values (1001, 100, 'PR1', 'AC1');
Insert into T Values (1001, 100, 'PR1', 'AC2');
Insert into T Values (1002, 100, 'PR1', 'AC1');
Insert into T Values (1003, 100, 'PR1', 'AC1');
Insert into T Values (1003, 100, 'PR1', 'AC2');
Insert into T Values (1004, 100, 'PR1', 'AC2');
Insert into T Values (1005, 100, 'PR1', 'AC1');
Insert into T Values (1005, 100, 'PR1', 'AC2');

COMMIT;

SELECT * FROM T;


提前感谢您的帮助。


专家解答

它们在AC列中似乎都有不同的值?为什么它们是重复的?

无论如何,要找到重复项,您需要做的就是:

-按标识重复行的表达式分组
-返回计数> 1的那些

例如:

SELECT pi, bu, pr, substr(ac, 1, 2) , count(*)
FROM   T
group  by pi, bu, pr, substr(ac, 1, 2)
having count(*) > 1;

PI     BU    PR    SUBSTR(AC,1,2)   COUNT(*)   
  1001   100 PR1   AC                        2 
  1003   100 PR1   AC                        2 
  1005   100 PR1   AC                        2 


您可以在以下位置阅读更多查找 (和删除!) 重复项的技术:

https://blogs.oracle.com/sql/how-to-find-and-delete-duplicate-rows-with-sql
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论