Фильтровать элементы, которые встречаются только один раз в очень большом списке

У меня есть большой список (более 1 000 000 элементов ), который содержит английские слова:

tokens = ["today", "good", "computer", "people", "good",... ]

Я хотел бы получить все элементы, которые встречаются только один раз в списке

теперь я использую :

tokens_once = set(word for word in set(tokens) if tokens.count(word) == 1)

, но это очень медленно. как я могу сделать это быстрее?

6
задан wong2 6 May 2012 в 07:42
поделиться