Я нахожусь в процессе создания корпоративного веб-сайта. Мы ищем любой открытый исходный код или механизм платного поиска на основе ASP.NET. Это должно смочь
Сообщите мне, какие инструменты или программное обеспечение мы должны рассмотреть.
Попробуйте Lucene.NET
Apache Lucene - это высокопроизводительная, полнофункциональная система поиска текста написанная полностью на Java. Это это технология, подходящая практически для любого приложения, требующего полнотекстовый поиск, особенно кроссплатформенных.
Lucene.Net - это исходный код, класс за классом, API за API и алгоритмический порт Java Lucene поисковой системы на C# и .NET платформу, использующую Microsoft .NET Framework.
Вот несколько ссылок на учебники для начала работы:
Solr - другой отличный вариант, это фактически фасад поверх lucene, который предоставляет вам хороший API на основе REST / url. Для работы с ним также есть доступная зрелая библиотека .Net.
http://lucene.apache.org/solr/
http://code.google.com/p/solrnet/
Однако, судя по вашему вопросу, вы ищете реальный базовый движок или вы ищете что-то, что можно было бы сканировать / просматривать по вашему содержанию, создавая индексы выбранной вами поисковой системы?
-
Редактирование для ответа на комментарий исходного автора.
Вам нужно решить две половины уравнения.
Сначала выбирается поисковая машина, которая реагирует на ввод (ключевые слова), а затем запрашиваются ее индексы и возвращаются то, что, по ее мнению, является подходящим соответствием. Вторая половина уравнения - это поиск механизма для заполнения поискового индекса выбранной вами системы.
Что касается движка, был предложен Lucene, и я предложил вариант Lucene, который обеспечивает (возможно) улучшенный интерфейс разработчика. С точки зрения построения корпуса поиска это немного другое. Здесь вы можете написать собственное программное обеспечение, которое берет часть контента и добавляет ее в индекс. Преимущество здесь в том, что у вас есть точный контроль над тем, что и когда попадает в поисковую систему.Обратной стороной является то, что вы пишете новый код - к счастью, современные поисковые системы, такие как Lucene / Solr, делают это довольно просто.
Второй вариант - использовать что-нибудь для автоматического сканирования вашего содержания и добавления его в индекс. Проблемы здесь заключаются в выявлении и обучении настройке соответствующей опции. В зависимости от вашего выбора поисковых роботов, он может или не может хорошо справляться с индексированием документов, находящихся в файловой системе (например, на корпоративном сайте Sharepoint).
Nutch - это краулер от Apache (создатели Lucene и Solr), который потенциально может быть использован, если вы решите не писать свой собственный код. http://wiki.apache.org/nutch/