Поисковая система для интеграции в стопке.NET

Я ищу очень устойчивую поисковую систему программного обеспечения для интеграции на веб-сайте .NET.

Текущим предлагаемым решением является Lucene.NET стек на основе Lucene. Однако я хотел бы оценить другие поисковые системы перед составлением моего ума.

Набор функций, в котором мы нуждаемся, следующий:

  • Способность проверить произвольные страницы через HTTP
  • Способность проанализировать карты сайта
  • Способность заставить списки URIs анализировать через поиск базы данных
  • Способность ограничить поиск конкретным языком/локалью
  • Способность ограничить поиск подмножеством страниц (например, через regex на URI)
  • Скорость и масштабируемость (это для общедоступного сайта с тонной трафика),
  • Должен иметь.NET поддержка API или суперлегкий находящийся в http API, который может быть перенесен в API.NET
  • Языковозависимая полнотекстовая поддержка

Другие вещи, которые были бы большими, но не недопустимое, если они не поддерживаются:

  • Создание отчетов
  • Искажение и смещение результатов
  • Основанные на HTTP страницы администрирования
  • Поддержка SQL Server

Что другие поисковые системы программного обеспечения работали на Вас? Есть ли кто-либо, которого Вы рекомендовали бы или что мы должны избежать?

9
задан Sklivvz 1 February 2010 в 16:45
поделиться

6 ответов

Lucene.net - это библиотека поиска информации, а не поисковая система. В частности, не будет не оказывает любого из:

  • веб-страниц или проанализирующих сайта
  • Отчетность
  • Администрирование HTTP-администрирования
  • поддержка SQL Server (Lucene.net использует свои собственные Простой, но высокоэффективный формат файла и не использует SQL Server)

, хотя я сильный сторонник или SQL, и порекомендул бы его как полнотекстовый поиск компонента поисковой системы, вам также понадобится гусеничный Компонент HTML Parser для создания полной функциональной поисковой системы, и вам придется тщательно разработать свои индексы Lucene.net, чтобы максимизировать производительность запросов, которые вы хотите (поиск по языку / локали)

Проект Solr , который представляет собой полностью прореченную поисковую систему с использованием Lucene - это может быть более подходящим для ваших потребностей.

3
ответ дан 4 December 2019 в 20:24
поделиться

Coveo - поисковая система, которую мы в настоящее время устанавливаем, чтобы заменить Google Mini, которая использовалась в течение ряда лет. Я просто указываю на них как на что-то, что нужно исследовать, так как я не использовал ни то, ни другое в недостаточной степени, чтобы знать, насколько они хороши. Я просто знаю о головной боли с каждой, много головной боли.

1
ответ дан 4 December 2019 в 20:24
поделиться

Как и другие, сказали, что, безусловно, идет с оригинальной Lucene, используя Solr. Интеграция его с .NET - Super Simple. Я на самом деле недавно вспоминал об этом: http://crazorsharp.blogspot.com/2010/01/full-text-search-us-solr-lucene-earch-html

1
ответ дан 4 December 2019 в 20:24
поделиться

Я бы порекомендовал обратить внимание на Solr. Он основан на Java, но соответствует ноге HTTP API ваших требований, предназначен для запуска на отдельном блоке/кластере от вашего основного приложения (так что вам не обязательно нужна Java AND .NET на одном и том же оборудовании), и он имеет большой импульс. Прошло много времени с тех пор, как я работал с ним, но я не помню, чтобы он работал с собственным гусеничным движком. Если это все еще так, то должно быть просто использовать отдельный гусеничный движок и вышеупомянутый API, чтобы заставить его работать.

1
ответ дан 4 December 2019 в 20:24
поделиться

Вместо того, чтобы использовать Lucene.Net напрямую, вы подумали о том, чтобы использовать что-то, что обёртывает его и предоставляет больше функциональности, похожей на то, что вам нужно?

Solr - это продукт Apache, который делает это, и для него также есть .Net клиент порт. Я никогда не использовал его в производстве, но он выглядит так, как будто он вам нужен.

Вдоль аналогичной идеи есть Nutch (написано парнем, который изначально написал Lucene), хотя я не знаю ни одной .Net версии. Nutch действительно имеет паукообразный компонент для сканирования сайтов.

1
ответ дан 4 December 2019 в 20:24
поделиться

Проверьте поисковый сервер Microsoft Express , хотя страница выглядит в данный момент, поэтому попробуйте ссылку .

Есть другие корпоративные двигатели, такие как Vivisimo Volocity (очень расширяемая), автономия и т. Д. Луче и Solr ограничены, трудно использовать и настроить, но это то, что вы получаете, когда хотите что-то бесплатно Отказ

3
ответ дан 4 December 2019 в 20:24
поделиться
Другие вопросы по тегам:

Похожие вопросы: