У меня есть большая коллекция (~ 2,7 миллиона документов) в mongodb, и там много дубликатов. Я попытался запустить sureIndex ({id: 1}, {unique: true, dropDups: true})
для коллекции. Mongo возится с этим некоторое время, прежде чем решит, что слишком много дубликатов при построении индекса с dropDups = true
.
Как добавить индекс и избавиться от дубликатов? Или, наоборот, как лучше всего удалить несколько дубликатов, чтобы mongo смог успешно построить индекс?
Почему для бонусных баллов существует ограничение на количество удаляемых дубликатов?