Мне нужен способ свернуть дубликат (определенный с точки зрения строкового поля с идентификатором) результаты в solr. Я знаю, что такая функция существует следующей версии (1.5), но я не могу ждать этого. Каков был бы лучший способ удалить дубликаты с помощью текущей стабильной версии 1.4?
Учитывая, что нахождение дубликатов в моем случае действительно легко (сравнение строкового поля), это должен быть Фильтр, я должен перезаписать существующий SearchComponent или записать новый Компонент или пользоваться некоторыми внешними библиотеками как carrot2?
Полное количество результата должно отразить сокращенный результат.
Что ж, есть решение: просто примените поле свертывания патч (последние новости об этой функции см. http://issues.apache.org/jira/browse/SOLR-236 , я также рекомендую вам http://blog.jteam.nl / автор / martijn ).
Выполнив это, вы получите работу CollapseComponent. Обратите внимание на снижение производительности поиска, связанное с этой функцией.