Query for searching duplicates rows on multiple columns

Question

Need to find the rows with duplicates data in a multiple columns

hID     sid    lid    aid    did     shid    soid         date
------------------------------------------------------------------
0       123    jkn    rbr    tm      asd     hjk       10/11/2008
1       563    kjh    jkh    dfsd    we      hjk       11/12/2010
2       131    jklj   jkjk   adsd    vcv     asd       01/01/2012
3       656    hjkh   hjkh   dasda   fas     fads      03/26/2012
4       123    jkn    rbr    tm      asd     hjk       09/09/2012

Should be able to return like dis one..

hID     sid    lid    aid    did     shid    soid         date
------------------------------------------------------------------
0       123    jkn    rbr    tm      asd     hjk       10/11/2008
4       123    jkn    rbr    tm      asd     hjk       09/09/2012

Any ideas? thanks in advance!

vladr · Accepted Answer · 2012-11-14 02:02:06Z

2

The query below is much more repetitive than @TimSchmelter's solution, but yields a measurable performance advantage for large tables with relatively few duplicates if you happen to have an index on sid, lid, aid, did, shid, soid.

SELECT t.* FROM t INNER JOIN (
  SELECT sid, lid, aid, did, shid, soid, COUNT(1) AS count FROM t
  GROUP BY sid, lid, aid, did, shid, soid HAVING COUNT(1) > 1
) tt ON t.sid=tt.sid AND t.lid=tt.lid AND t.aid=tt.aid AND t.did=tt.did AND t.shid=tt.shid AND t.soid=tt.soid;

edited Nov 14, 2012 at 2:02

answered Nov 13, 2012 at 7:02

vladr

67k18 gold badges131 silver badges132 bronze badges

Sign up to request clarification or add additional context in comments.

Comments

Tim Schmelter · Accepted Answer · 2012-11-13 07:04:56Z

1

You can GROUP BY multiple columns. But since you want to find all duplicates you can use EXISTS:

SELECT
   hID, sid, lid, aid, did, shid, soid, date
FROM TableName t1
WHERE EXISTS
(
   SELECT 1 FROM TableName t2
   WHERE t2.hid <> t1.hid
   AND  t2.sid  = t1.sid   
   AND  t2.lid  = t1.lid    
   AND  t2.aid  = t1.aid   
   AND  t2.did  = t2.did
   AND  t2.shid = t2.shid   
   AND  t2.soid = t2.soid
)

answered Nov 13, 2012 at 7:04

Tim Schmelter

462k79 gold badges719 silver badges980 bronze badges

Comments

mvp · Accepted Answer · 2012-11-13 07:43:03Z

1

This works in all SQL servers I tried (SQLFiddle):

SELECT * FROM t
WHERE (sid,lid,aid,did,shid,soid) IN (
    SELECT sid,lid,aid,did,shid,soid
    FROM t
    Group By 1,2,3,4,5,6
    HAVING count(1) > 1
)

answered Nov 13, 2012 at 7:43

mvp

118k15 gold badges132 silver badges155 bronze badges

Comments

CraigTeegarden · Accepted Answer · 2013-04-16 17:23:21Z

0

;with tempTable as
(
select *, row_number() over(partition by sid, lid, aid, did, shid, soid order by hid asc )  as rowid
from #table)
select *
from tempTable
where rowid>1

edited Apr 16, 2013 at 17:23

CraigTeegarden

8,2558 gold badges40 silver badges43 bronze badges

answered Apr 16, 2013 at 17:02

user2287500

1

1 Comment

user2287500 Over a year ago

this will return the duplicated row only.

Collectives™ on Stack Overflow

Query for searching duplicates rows on multiple columns

4 Answers 4

Comments

Comments

Comments

1 Comment

Your Answer

Linked

Hot Network Questions

Collectives™ on Stack Overflow

4 Answers 4

Comments

Comments

Comments

1 Comment

Your Answer

Sign up or log in

Post as a guest

Linked

Related