Я ищу очень устойчивую поисковую систему программного обеспечения для интеграции на веб-сайте .NET.
Текущим предлагаемым решением является Lucene.NET стек на основе Lucene. Однако я хотел бы оценить другие поисковые системы перед составлением моего ума.
Набор функций, в котором мы нуждаемся, следующий:
Другие вещи, которые были бы большими, но не недопустимое, если они не поддерживаются:
Что другие поисковые системы программного обеспечения работали на Вас? Есть ли кто-либо, которого Вы рекомендовали бы или что мы должны избежать?
Lucene.net - это библиотека поиска информации, а не поисковая система. В частности, не будет не оказывает любого из:
, хотя я сильный сторонник или SQL, и порекомендул бы его как полнотекстовый поиск компонента поисковой системы, вам также понадобится гусеничный Компонент HTML Parser для создания полной функциональной поисковой системы, и вам придется тщательно разработать свои индексы Lucene.net, чтобы максимизировать производительность запросов, которые вы хотите (поиск по языку / локали)
Проект Solr , который представляет собой полностью прореченную поисковую систему с использованием Lucene - это может быть более подходящим для ваших потребностей.
Coveo - поисковая система, которую мы в настоящее время устанавливаем, чтобы заменить Google Mini, которая использовалась в течение ряда лет. Я просто указываю на них как на что-то, что нужно исследовать, так как я не использовал ни то, ни другое в недостаточной степени, чтобы знать, насколько они хороши. Я просто знаю о головной боли с каждой, много головной боли.
Как и другие, сказали, что, безусловно, идет с оригинальной Lucene, используя Solr. Интеграция его с .NET - Super Simple. Я на самом деле недавно вспоминал об этом: http://crazorsharp.blogspot.com/2010/01/full-text-search-us-solr-lucene-earch-html
Я бы порекомендовал обратить внимание на Solr. Он основан на Java, но соответствует ноге HTTP API ваших требований, предназначен для запуска на отдельном блоке/кластере от вашего основного приложения (так что вам не обязательно нужна Java AND .NET на одном и том же оборудовании), и он имеет большой импульс. Прошло много времени с тех пор, как я работал с ним, но я не помню, чтобы он работал с собственным гусеничным движком. Если это все еще так, то должно быть просто использовать отдельный гусеничный движок и вышеупомянутый API, чтобы заставить его работать.
Вместо того, чтобы использовать Lucene.Net напрямую, вы подумали о том, чтобы использовать что-то, что обёртывает его и предоставляет больше функциональности, похожей на то, что вам нужно?
Solr - это продукт Apache, который делает это, и для него также есть .Net клиент порт. Я никогда не использовал его в производстве, но он выглядит так, как будто он вам нужен.
Вдоль аналогичной идеи есть Nutch (написано парнем, который изначально написал Lucene), хотя я не знаю ни одной .Net версии. Nutch действительно имеет паукообразный компонент для сканирования сайтов.
Проверьте поисковый сервер Microsoft Express , хотя страница выглядит в данный момент, поэтому попробуйте ссылку .
Есть другие корпоративные двигатели, такие как Vivisimo Volocity (очень расширяемая), автономия и т. Д. Луче и Solr ограничены, трудно использовать и настроить, но это то, что вы получаете, когда хотите что-то бесплатно Отказ