Я работаю, Solr 1.4 на Ubuntu 10.04 (установленный через Кв. - получают solr-кота), и это, кажется, хорошо работает. Я испытываю некоторые затруднения при нахождении любой когерентной информации о том, как индексировать документы все же. Я плохо знаком дл
Я хочу проиндексировать большое количество документов pdf. Я нашел ссылку, показывающую, что это можно сделать с помощью Apache Tika, но, к сожалению, я не могу найти ни одной ссылки, описывающей, что я мог бы ...
Я тщетно пытаюсь заставить последнюю версию Sunspot gem (в настоящее время 2.0.0.pre.111215, включающую Solr 3.5) работать с Solr Cell. В настоящее время я использую более старую версию Sunspot ...
Для индексации моего веб-сайта у меня есть сценарий Ruby, который, в свою очередь, генерирует сценарий оболочки, который загружает каждый файл в корень моего документа в Solr. В сценарии оболочки есть много строк, которые выглядят так: curl -s \ "...
Кто-нибудь может указать мне на учебник. Мой основной опыт работы с Solr - это индексирование файлов CSV. Но я не могу найти никаких простых инструкций / учебников, которые рассказали бы мне, что мне нужно делать для индексации PDF-файлов. Я видел это
Я индексирую PDF-файлы с помощью Solr, используя ExtractingRequestHandler. Я хотел бы отображать номер страницы вместе с совпадениями в документе, например, «термин foo был найден в bar.pdf на страницах 2, 3 и 5». Это ...