Как я индексирую документы в SOLR?

Question

Как я индексирую документы в SOLR?

Я работаю, Solr 1.4 на Ubuntu 10.04 (установленный через Кв. - получают solr-кота), и это, кажется, хорошо работает. Я испытываю некоторые затруднения при нахождении любой когерентной информации о том, как индексировать документы все же. Я плохо знаком с SOLR, так терпите меня! У меня есть папка (/mnt/folder), который является смонтированной долей окон, которая содержит Word и файлы PDF, которые я хотел бы индексированный, что самый легкий путь состоит в том, чтобы заставить SOLR индексировать всю папку?

Документация для SOLR довольно плоха, ее невозможное для нахождения любых достойных учебных руководств при добивании цели с ним так, любая справка значительно ценится!

S

7

solr full-text-search apache-tika solr-cell

задан javanna 8 December 2011 в 09:42

2 ответа

Другие вопросы по тегам:

solr full-text-search apache-tika solr-cell

Похожие вопросы:

score 0 · Answer 1

Я обнаружил те же проблемы с основной документацией, но я наткнулся на очень полезное справочное руководство от LucidImagination, которое помогло прояснить многое о SOLR:

http://docs.lucidworks.com/display/solr/Apache+Solr+Reference+Guide

score 7 · Answer 2

Взгляните на Solr wiki , это довольно подробная документация.

В частности, см. ExtractingRequestHandler , который позволяет индексировать двоичные файлы, такие как документы Word и PDF. Вот введение в тему.

Если вам недостаточно вики, есть еще отличная книга о Сольре .