Nutch по сравнению с Solr

В настоящее время собирая информацию, где я должен использовать Nutch с Solr (домен - вертикальный веб-поиск).

Вы могли предложить меня?

8
задан nbro 30 November 2016 в 13:32
поделиться

1 ответ

Nutch - это фреймворк для создания веб-краулеров и поисковых систем. Nutch может выполнять весь процесс от сбора веб-страниц до построения инвертированного индекса. Он также может передавать эти индексы в Solr.

Solr - это в основном поисковая система с поддержкой фасетного поиска и многих других интересных функций. Но Solr не получает данные, вы должны их предоставить.

Так что, возможно, первое, что вы должны спросить, чтобы выбрать между этими двумя системами, это есть ли у вас уже данные, которые нужно проиндексировать (в XML, в CMS или базе данных). В этом случае, вероятно, вам следует просто использовать Solr и предоставить ему эти данные. С другой стороны, если вам нужно получить данные из Интернета, вам, вероятно, лучше использовать Nutch.

15
ответ дан 5 December 2019 в 11:23
поделиться