Поисковая система ASP.NET

Я нахожусь в процессе создания корпоративного веб-сайта. Мы ищем любой открытый исходный код или механизм платного поиска на основе ASP.NET. Это должно смочь

  1. Поисковый веб-контент всех страниц в сайте.
  2. Все офисные документы. и т.д.
  3. Если у нас есть некоторый searach reseults фильтрующий на основе пользовательского типа и жесткий.

Сообщите мне, какие инструменты или программное обеспечение мы должны рассмотреть.

6
задан user171523 21 February 2010 в 17:58
поделиться

2 ответа

Попробуйте Lucene.NET

Apache Lucene - это высокопроизводительная, полнофункциональная система поиска текста написанная полностью на Java. Это это технология, подходящая практически для любого приложения, требующего полнотекстовый поиск, особенно кроссплатформенных.

Lucene.Net - это исходный код, класс за классом, API за API и алгоритмический порт Java Lucene поисковой системы на C# и .NET платформу, использующую Microsoft .NET Framework.

Вот несколько ссылок на учебники для начала работы:

7
ответ дан 10 December 2019 в 02:46
поделиться

Solr - другой отличный вариант, это фактически фасад поверх lucene, который предоставляет вам хороший API на основе REST / url. Для работы с ним также есть доступная зрелая библиотека .Net.

http://lucene.apache.org/solr/

http://code.google.com/p/solrnet/

Однако, судя по вашему вопросу, вы ищете реальный базовый движок или вы ищете что-то, что можно было бы сканировать / просматривать по вашему содержанию, создавая индексы выбранной вами поисковой системы?

-

Редактирование для ответа на комментарий исходного автора.

Вам нужно решить две половины уравнения.

Сначала выбирается поисковая машина, которая реагирует на ввод (ключевые слова), а затем запрашиваются ее индексы и возвращаются то, что, по ее мнению, является подходящим соответствием. Вторая половина уравнения - это поиск механизма для заполнения поискового индекса выбранной вами системы.

Что касается движка, был предложен Lucene, и я предложил вариант Lucene, который обеспечивает (возможно) улучшенный интерфейс разработчика. С точки зрения построения корпуса поиска это немного другое. Здесь вы можете написать собственное программное обеспечение, которое берет часть контента и добавляет ее в индекс. Преимущество здесь в том, что у вас есть точный контроль над тем, что и когда попадает в поисковую систему.Обратной стороной является то, что вы пишете новый код - к счастью, современные поисковые системы, такие как Lucene / Solr, делают это довольно просто.

Второй вариант - использовать что-нибудь для автоматического сканирования вашего содержания и добавления его в индекс. Проблемы здесь заключаются в выявлении и обучении настройке соответствующей опции. В зависимости от вашего выбора поисковых роботов, он может или не может хорошо справляться с индексированием документов, находящихся в файловой системе (например, на корпоративном сайте Sharepoint).

Nutch - это краулер от Apache (создатели Lucene и Solr), который потенциально может быть использован, если вы решите не писать свой собственный код. http://wiki.apache.org/nutch/

2
ответ дан 10 December 2019 в 02:46
поделиться
Другие вопросы по тегам:

Похожие вопросы: