Начало работы с Solr

Я пытаюсь начать работу с Apache Solr, но некоторые вещи мне непонятны. Прочитав учебник, я установил работающий экземпляр Solr. Меня смущает то, что все настройки Solr (схемы и так далее) представлены в формате XML. Когда они добавляют примеры данных, показано, как добавлять документы xml (java -jar post.jar solr.xml monitor.xml). Может быть, это просто неудачный выбор формата образца? Я имею в виду, они загружают данные, описывающие документы, или фактические документы, которые они добавляют, это файлы .xml?

Я пытаюсь добавить несколько книг в формате .txt, так что если я использую java -jar post.jar solr.post.jar mydoc.txt, добавляю ли я его? Как я могу добавить этот документ и метаданные (автор, название) о нем?

С учетом этого я попытался настроить простую Html-страницу для размещения документов в Solr:


  

  

Когда я пытаюсь разместить файл, я получаю такой ответ:


  
    0
    26
  

Это правильно? Означает ли это, что я успешно добавил свой файл? Если да, то одно из слов в файле, например, "montagna" (это итальянская книга, montagna означает гора...). Если я перейду по url

http://localhost:8983/solr/select/?q=montagna&start=0&rows=10&indent=on

я ожидаю, что мне что-то вернут (возможно, весь текст или какую-то информацию о файле), но вот что я получаю:


  
    0
      1
      
        on
        0
        montagna
        10
    
  
  

Мне кажется, что это не совпадение. Также, согласно этому ответу, я должен быть в состоянии получить обратно текст, окружающий совпадения с помощью hl.fragsize. Как мне интегрировать это в строку поиска? Спасибо

6
задан Community 23 May 2017 в 12:03
поделиться