Removing duplicates from a dict

**bvdet** · Feb 16 '12, 03:37 PM

Don't use dict as an identifier. It will mask built-in function dict().

Following are a couple of ways:

Code:

dd = {'file1.txt': ['A', 'B' , 'C' , 'D' , 'E' ] ,
      'file2.txt': ['A', 'F' , 'C' , 'G' , 'E' ] ,
      'file3.txt': ['T', 'F' , 'C']}

# Create a dictionary with a count of labels
dd1 = {}
for seq in dd.values():
    for label in seq:
        v = dd1.get(label, 0)
        dd1[label] = v+1

for key in dd:
    dd[key] = [label for label in dd[key] if dd1[label] == 1]
print dd


dd = {'file1.txt': ['A', 'B' , 'C' , 'D' , 'E' ] ,
      'file2.txt': ['A', 'F' , 'C' , 'G' , 'E' ] ,
      'file3.txt': ['T', 'F' , 'C']}

# Create an extended list from dd.values()
extended = dd.values()[0][:]
for seq in dd.values()[1:]:
    extended.extend(seq[:])
for key in dd:
    dd[key] = [label for label in dd[key] if extended.count(label) == 1]
print dd

Output:

Code:

>>> {'file1.txt': ['B', 'D'], 'file3.txt': ['T'], 'file2.txt': ['G']}
{'file1.txt': ['B', 'D'], 'file3.txt': ['T'], 'file2.txt': ['G']}
>>>

Removing duplicates from a dict

Removing duplicates from a dict

Comment