inking_sphinx и sphinx работают прекрасно, никаких проблем с индексацией, запросами, установкой (5 или 6 установок, включая рабочий slicehost)
почему не все использовать сфинкса, как, скажем, Craigslist? читайте здесь о его ограничениях (полтора года тому назад. Разработчик сфинксов, Аксёнов, работает над этим, он добавляет функции и надежность, а также замечательно устраняет ошибки)
http://codemonkey.ravelry.com/2008/01/09/sphinx-for-search/
http://www.ibm.com/developerworks/ opensource / library / os-php-apachesolr /
Сравнение полнотекстового поискового движка - Lucene, Sphinx, Postgresql, MySQL?
ferret: легкая установка, не работает должным образом, очень медленная индексация (один mysql db: sphinx: 3 секунды, ferret: 50 минут). Хорошо задокументированные проблемы (повреждение индекса) на серверах drb в рабочей среде под нагрузкой. Сказав это, я использую его в develometn, так как act-as_ferret вышел 3 года назад, и он мне хорошо послужил. Несоблюдение правил портера является преимуществом в некоторых контекстах.
Lucene and Solr - чемпион по поиску с открытым исходным кодом для горилл / маков и тяжеловесов. В выпуске solr 14 команды реализовали впечатляющее количество новых функций:
действует как соль: работает хорошо, когда кот или причал находится в место, но иногда это боль. Вилка A-A-S от mattmatt является основной вилкой, но проект относительно не поддерживается.
По поводу установки tomcat: у SOLR / lucene, несомненно, лучшая база знаний / поисковая система поддержки среди всех программных пакетов, которые я когда-либо видел (думаю, я не удивлен), поле поиска здесь:
http://www.lucidimagination.com/
Солнечное пятно новой рубиновой оболочки, построить на solr-ruby. Выглядит многообещающе, но я не смог заставить его установить на OSX. Индексирует все объекты ruby, а не только базы данных через AR
Одна вещь, которая действительно поучительна, - это установить 2 поисковых плагина, например, sphinx и SOLR, sphinx и ferret, и посмотрите, какие разные результаты они возвращают. Это так же просто, как @sphinx_results - @ferret_results
только что увидел этот пост и ответы
http://www.jroller.com/otis/entry/open_source_search_engine_benchmark
SearchLogic - хороший плагин, но он действительно предназначен для того, чтобы сделать ваш поисковый код более читабельным, он не обеспечивает автоматическую индексацию, как это делает Sphinx. Я не использовал Ферре, но Сфинкс невероятно силен.
http://railscasts.com/episodes/120-thinking-sphinx
Отличное введение, чтобы увидеть, насколько он гибок.
Для тех, кто ищет простой поисковый камень без каких-либо зависимостей, ознакомьтесь с acts_as_indexed
Во-первых, моя очевидная предвзятость: я создал и поддерживаю Thinking Sphinx.
Так получилось, что я действительно видел, как Бен Джонсон (создатель SearchLogic) присутствовал на рубиновой встрече в Нью-Йорке по этому поводу прошлой ночью. SearchLogic поддерживает только SQL, поэтому, если вы не имеете дело с большими таблицами и ранжирование релевантности не требуется, это может быть именно то, что вы ищете. Синтаксис тоже довольно чистый.
Однако, если вы хотите, чтобы весь интеллект запросов обрабатывался чужим кодом, то Sphinx или Solr (который, я думаю, является Lucene под капотом), вероятно, сработает. лучше.
Я не использовал SearchLogic, но могу сказать вам, что Lucene - очень зрелый проект, реализованный на многих языках. Это быстрый и гибкий API, с которым приятно работать. Хорошая ставка.
Лично я не беспокоюсь об агностиках баз данных для веб-приложений и вполне доволен использованием полнотекстового поиска в pg83. Преимущество состоит в том, что если и когда вы измените структуру / язык, у вас по-прежнему будет полнотекстовый поиск.