У некоторых моих коллег есть большое веб-приложение Java, которое использует поисковую систему, созданную с Java Lucene. То, что я хотел бы сделать, имеют хороший основанный на HTTP API для доступа к тем существующим поисковым индексам. Я использовал Nutch прежде и действительно любил, как простой реализация OpenSearch добралась до результатов захвата как до RSS.
Я попытался установить dataDir Solr в solrconfig.xml, надеясь, что он счастливо взял бы существующие индексные файлы, но это, кажется, просто игнорирует их.
Мой основной вопрос:
Solr может использоваться для доступа к индексам Lucene, созданным в другом месте? Или могло бы там быть лучшее решение?
Я никогда не пробовал этого, но вам придется настроить schema.xml, чтобы включить все поля документов, которые есть в вашем индексе Lucene, потому что Solr не позволит вам искать поле, если оно не определено в schema.xml.
Корректировка schema.xml должна также включать определение анализаторов времени запроса для правильного поиска в вашем поле, особенно если это поле индексируется с помощью пользовательских анализаторов.
В solrconfig.xml вам может потребоваться изменить настройки в разделах indexDefaults и mainIndex.
Но я был бы счастлив прочитать ответы людей, которые действительно это сделали.
Успех! С предложением Паскаля об изменениях в schema.xml я быстро заработал. Спасибо!
Вот мои полные шаги для всех, кто интересуется:
Для меня это просто доказательство того, что это может работать. Очевидно, предстоит еще многое сделать.