Я пытаюсь начать работу с Apache Solr, но некоторые вещи мне непонятны. Прочитав учебник, я установил работающий экземпляр Solr. Меня смущает то, что все настройки Solr (схемы и так далее) представлены в формате XML. Когда они добавляют примеры данных, показано, как добавлять документы xml (java -jar post.jar solr.xml monitor.xml
). Может быть, это просто неудачный выбор формата образца? Я имею в виду, они загружают данные, описывающие документы, или фактические документы, которые они добавляют, это файлы .xml?
Я пытаюсь добавить несколько книг в формате .txt, так что если я использую java -jar post.jar solr.post.jar mydoc.txt
, добавляю ли я его? Как я могу добавить этот документ и метаданные (автор, название) о нем?
С учетом этого я попытался настроить простую Html-страницу для размещения документов в Solr:
Когда я пытаюсь разместить файл, я получаю такой ответ:
0
26
Это правильно? Означает ли это, что я успешно добавил свой файл? Если да, то одно из слов в файле, например, "montagna" (это итальянская книга, montagna означает гора...). Если я перейду по url
http://localhost:8983/solr/select/?q=montagna&start=0&rows=10&indent=on
я ожидаю, что мне что-то вернут (возможно, весь текст или какую-то информацию о файле), но вот что я получаю:
0
1
on
0
montagna
10
Мне кажется, что это не совпадение. Также, согласно этому ответу, я должен быть в состоянии получить обратно текст, окружающий совпадения с помощью hl.fragsize
. Как мне интегрировать это в строку поиска? Спасибо