Я настраиваю свой solr для двух ядер и имею большую часть из него работа, но я получаю эту загадочную ошибку. Прежде всего вот мой solr.xml: <? версия xml = '1.0' кодирование ='UTF-8'?> <solr...
Я не могу понять различие между mergefactor и minMergeDocs. Для, например, Я хочу к индексным 10,000 Документам и говорю, что 100 из тех Документов заполняют мой буфер RAM, таким образом, Lucene выпишет...
Немецкие символы Umlaut с диакритическим знаком “ö”, “ä” и “ü” часто заменяются версиями нес диакритическим знаком, когда пользователи вводят, часто для удобства, когда у них нет корректной клавиатуры. С большинством...
Может любой предоставлять мне некоторый демонстрационный код Java как, как пойти о хранении индекса Lucene в HDFS (Файл Hadoop Sytem), с помощью Katta.
Я использую SOLR наряду с NGramTokenizerFactory, чтобы помочь создать поисковые маркеры для подстрок слов, NGramTokenizer настроен с минимальной длиной слова 3, Это означает, что я могу искать e....
Я работаю над использованием приложения Windows Lucene. Я хочу получить все индексируемые ключевые слова и использовать их в качестве источника для автопредложения на поле поиска. Как я могу получить все индексируемые ключевые слова в...
Существует ли встроенные технические возможности в solr/lucene для фильтрации результатов, если они падают ниже определенного порога счета? Скажем, если я обеспечиваю порог счета.2, затем все документы со счетом...
Как я могу включить различные анализаторы для каждого поля в документе, который я индексирую с Lucene? Пример: dir RAMDirectory = новый RAMDirectory (); IndexWriter iw = новый IndexWriter (dir, новый...
Что лучший способ состоит в том, чтобы обновить существующий индекс Lucene. Я dont't просто должен добавить/удалить документы от него, скорее обновить существующие документы.
Я использую API Lucene.NET непосредственно в моем веб-приложении ASP.NET/C#. Когда я ищу использование подстановочного знака, как "fuc*", маркер ничего не выделяет, но когда я ищу целое слово...
В последней версии Lucene (или Lucene.NET), что надлежащий путь состоит в том, чтобы вернуть результаты поиска в отсортированном порядке? У меня есть документ как это: документ var = новый Lucene. Документ (); документ....
Я пытаюсь использовать Apache Lucene для маркирования, и я экранирован при процессе для получения Маркеров из TokenStream. Худшая часть - то, что я смотрю на комментарии в JavaDocs, которые обращаются к моему...
Учитывая следующий запрос: (field:value1 ИЛИ field:value2 ИЛИ field:value3 ИЛИ... ИЛИ field:value50), это может быть разломано на что-то менее подробное? В основном у меня есть сотни категории ID, и...
У меня есть некоторое использование кода Lucene, который оставляет оператор соединения по умолчанию как ИЛИ, и я хочу изменить его на И. Часть кода просто использует плоскость QueryParser, и это прекрасно - я могу просто звонить...
Мой вопрос вкратце: кто-либо знает о TwitterAnalyzer или TwitterTokenizer для Lucene? Более подробная версия: Я хочу индексировать много твитов в Lucene и сохранить условия как @user или #...
Я читаю, что могу создать mahout векторы из индекса lucene, который может использоваться для применения mahout кластеризирующиеся алгоритмы. http://cwiki.apache.org/confluence/display/MAHOUT/Creating+Vectors+from+...
У меня есть проблема с Solr и Faceting и задающийся вопросом, знает ли кто-либо о фиксации. У меня есть работа вокруг для него в минуту, однако я действительно хочу разработать, почему мой запрос не работает. Вот мой...
Бит перепутал здесь, Как несколько отличаются Solr или Solrnet от Поиска Nhibernate? Solr предлагает что-нибудь больше Lucene.net это Поиск Nhibernate?
Я хочу разжечь запрос в luke для индексированного документа luncene. Я хочу отсортировать результаты, прежде чем они будут выбраны. Что lucene синтаксис должен отсортировать данные. Мне не нужен java/or-language-specific...
Действительно ли возможно искать на использовании диапазонов даты Lucene в Java? Как я создаю поисковые запросы Lucene на основе диапазонов дат и полей даты? Например: между указанными датами до указанного...
У меня есть индекс lucene, я пытаюсь сделать подстановочный поиск. В индексе у меня есть символ как '234Test2343', я пытаюсь сделать поиск как %Test %.. Мой lucene синтаксис похож на строку catalogNumber = "...
Я использую Zend_Search_Lucene для создания индекса статей, чтобы позволить им искаться на моем веб-сайте. Каждый раз, когда администратор обновляет/создает/удаляет статью в администраторской области, индекс...
Мне предложили использовать Поле. Установите (верный) OmitNorms; при создании документов для lucenesearch для сортировки результата согласно количеству хитов но я не свободен от того, что это делает и является этим...
С Lucene, каков был бы рекомендуемый подход для определения местоположения соответствий в результатах поиска? Строго говоря, предположите, что индексные документы имеют поле "fullText", который хранит содержание простого текста...
Как я могу сделать Фильтр через несколько полей в Lucene. Сеть? На одном поле я просто делаю: инструмент TermQuery = новый TermQuery (новый Термин ("Инструмент", "Гвоздь")); Отфильтруйте f = новый QueryFilter (инструмент); Если я тепер
Я не могу найти простой ответ "да" или "нет" на это! Я знаю, что могу отправить несколько чтений параллельно, но я могу запросить индекс, в то время как отдельный процесс/поток обновляет его?
Я являюсь новым в Lucene, я пытаюсь сделать поиск чем-то вроде этого довольным = "некоторый thext" и (идентификатор = или идентификатор = "B" или идентификатор = "c"), я действительно потерян, с которым, мог Вы помогать мне С
Я использую Zend_Search_Lucene, порт PHP Java Lucene. У меня в настоящее время есть некоторый код, который создаст поисковый запрос на основе массива строк, находя результаты для который по крайней мере одно индексное поле...
У меня есть существующий код, на который это похоже: заключительный Термин t =/*... */; заключительный Итератор i = searcher.search (новый TermQuery (t)) .iterator (); в то время как (i.hasNext ()) {хит Хита = (Хит) i.next ();//"ФАЙЛ"...
Удивление, как достигнуть разбиения на страницы в Lucene, поскольку это по сути не поддерживает разбиение на страницы. Я в основном должен искать 'лучшие 10 записей' (на основе некоторого параметра) тогда 'следующие 10 записей' и так далее...