0
ответов

Исключение Solr часто возникает на сервере org.mortbay.jetty.EofException java.net.SocketException: Broken pipe

это исключение часто возникает, когда система вставляет новую запись db и обновляет индекс solr, есть ли у кого-нибудь такое же проблема ? как этого избежать? 29 марта 2012 г. 18:26:59 org.apache.solr.core....
вопрос задан: 30 March 2012 01:31
0
ответов

Как восстановить поврежденный индекс Lucene?

На моем сервере произошел сбой питания, и индекс Lucene был поврежден. Я запустил IndexChecker, но он не работает: java -cp /home/dthoai/programs/paesia/checker/lucene-core-3.5.0.jar -ea:org.apache.lucene... org.apache....
вопрос задан: 29 March 2012 23:41
0
ответов

Сортировка разных групп с использованием разных порядков сортировки в solr

Мы используем solr для создания приложения электронной коммерции, и у нас есть продукты, сгруппированные по подкатегориям в родительской категории. Мы используем порядок динамической сортировки, чтобы определить, к какой категории принадлежит продукт...
вопрос задан: 28 March 2012 22:50
0
ответов

lucene:повторно открыть indexreader после индекса

, когда мой поисковый сервер начнет работать, он загрузит весь индекс сразу для всех запросов. Однако он по-прежнему использует старый индекс, даже если я перестрою индекс. Поэтому я думаю, что я должен сообщить...
вопрос задан: 27 March 2012 08:06
0
ответов

Индексирование Neo4j (с Lucene)-Хороший способ упорядочить «типы» узлов?

На самом деле это скорее вопрос Lucene, но в контексте базы данных neo4j. У меня есть база данных, которая разделена примерно на 50 типов узлов (, так что «коллекции» или «таблицы» в других типах…
вопрос задан: 26 March 2012 20:39
0
ответов

Lucene: как увеличить какое-то конкретное поле

В моем случае документы имеют два поля, например, "название" и "просмотры" ". «Просмотры» представляют количество раз, когда люди посещали этот документ. например: «название»: «iphone», «просмотры»: «10». У меня есть...
вопрос задан: 22 March 2012 19:27
0
ответов

Сравнение MultiSearcher от Lucene и IndexSearcher с MultiReader

Я собираюсь написать приложение для поиска почти в реальном времени с распределенными индексами. Теперь мне интересно, каков правильный подход к реализации поиска по нескольким индексам: я читал о ...
вопрос задан: 22 March 2012 11:08
0
ответов

Может ли solr возвращать значения функции (не solr score или поля документа)?

Мы делаем запрос solr, в котором мы задаем пользовательскую функцию (которая довольно сложна) и сортируем результаты по значению этой функции. Запрос выглядит примерно так: solr/select?customFunc=...
вопрос задан: 22 March 2012 10:49
0
ответов

Как реализовать поиск значений int в поиске в спящем режиме?

Я пытаюсь выполнить поиск целочисленного значения. Я аннотировал параметр с помощью @Field следующим образом: @Field (name = "confirmedCount", index = UN_TOKENIZED, store = Store.YES) public int ...
вопрос задан: 20 March 2012 14:23
0
ответов

Lucene: как получить оценку документа

Я хочу вывести оценку документов. Я пишу для этого следующий код: IndexReader reader = IndexReader.open(FSDirectory.open(indexDir)); Искатель IndexSearcher = новый IndexSearcher(читатель); ...
вопрос задан: 19 March 2012 13:52
0
ответов

NHibernate Search — несколько веб-серверов

Я использую сборку NHibernate.Search и ищу передовой опыт использования ее с несколькими веб-серверами. У нас достаточно места на наших веб-серверах для обработки индексов, которые мы...
вопрос задан: 17 March 2012 21:32
0
ответов

Что является лучшим выбором для индексации логического значения в lucene?

Индексирование логического значения (true/false) в lucene (не нужно хранить) Я хочу увеличить использование дискового пространства и повысить производительность поиска doc.add(new Field("boolean","true",Field.Store.NO,Field.Index....
вопрос задан: 12 March 2012 03:43
0
ответов

отсутствует функция в снимке lucene 4.0

Я пытаюсь использовать версию снимка lucene 4.0, однако StandardAnalyzer отсутствует в этом версия :(. Кто-нибудь знает, как это заменить? В примере кода, приведенном в обзоре Lucene, ...
вопрос задан: 7 March 2012 15:22
0
ответов

создать новые основные каталоги в SOLR на the fly

Я использую solr 1.4.1 для построения распределенной поисковой системы, но я не хочу использовать только один индексный файл - я хочу создавать новые основные "index" -директории на лету в моем java-коде. я обнаружил ...
вопрос задан: 7 March 2012 07:30
0
ответов

Как настроить поле, чтобы строка оставалась уникальной в lucene?

Мое приложение создает уникальный идентификатор для каждой строки, индексируемой в lucene и сохраняемой в базе данных. Одна проблема заключается в том, что если есть строка с одинаковым идентификатором, я хочу обновить ее, а не вставлять новую строку и и
вопрос задан: 7 March 2012 02:36
0
ответов

TermQuery не возвращается по известному поисковому запросу, но WildcardQuery возвращает

Я надеюсь, что кто-то, обладающий достаточным пониманием внутренней работы Lucene, сможет указать мне в правильном направлении =) Я пропущу большую часть окружающего
вопрос задан: 1 March 2012 08:25
0
ответов

Как классифицировать документы, проиндексированные с помощью lucene

Я классифицировал набор документов с помощью Lucene (поля: контент, категория). У каждого документа есть своя собственная категория, но некоторые из них помечены как некатегоризованные. Есть ли способ классифицировать эти ...
вопрос задан: 27 February 2012 07:05
0
ответов

Как мне увидеть / отладить способ, которым SOLR находит результаты?

Допустим, я ищу «ABLS», и SOLR возвращает результат, который для меня не имеет никакого смысла. Как я могу отладить, почему SOLR выбрал эту запись для возврата?
вопрос задан: 23 February 2012 23:26
0
ответов

Zend_Search_Lucene пытается выделить 3503812093817007931 байт

У меня есть около 250 КБ статического HTML-кода, в котором я должен выполнить поиск. Я решил, что для этого воспользуюсь Zend Lucene. Создание индексов занимает несколько секунд, и все хорошо, за исключением случаев, когда я ищу «примерно» ...
вопрос задан: 23 February 2012 09:20
0
ответов

Где я могу найти эталоны производительности для Apache Lucene/Solr

Есть ли ссылки/ресурсы на эталоны производительности Lucene/Solr на больших наборах данных. Наборы данных свыше 500 ГБ ~ 5 ТБ Спасибо
вопрос задан: 22 February 2012 11:01
0
ответов

Хорошая практика - держать Lucene IndexWriter и IndexSearcher открыт на время существования приложения

В документации Lucene указано, что быстрее всего использовать один экземпляр IndexWriter и IndexSearcher в приложении. На данный момент у меня есть статический экземпляр IndexWriter, открытый в ...
вопрос задан: 21 February 2012 12:24
0
ответов

Использование CLucene против java lucene

В настоящее время я использую Java lucene для одного из проектов и получаю нормальную производительность. Я ищу вариант C / C ++ для lucene и наткнулся на CLucene на sourceforge. Но я хотел проверить ...
вопрос задан: 17 February 2012 07:27
0
ответов

как я могу избежать группы специальных символов в java одним методом?

я использую поиск lucene, но lucene имеет набор специальных символов для экранирования, например: - && | | ! () {} [] ^ "~ *?: \ У меня проблема с экранированием этих символов, потому что их слишком много ...
вопрос задан: 17 February 2012 06:26
0
ответов

Улучшение многопоточной индексации с помощью lucene

Я пытаюсь создать свои индексы в Lucene с несколькими потоками. Итак, я начал писать код и написал следующий код. Сначала я нахожу файлы и для каждого файла создаю поток для его индексации. После ...
вопрос задан: 16 February 2012 19:43
0
ответов

Вы индексировали результаты сканирования Nutch раньше с помощью elasticsearch?

Кому-нибудь удавалось писать пользовательские индексаторы для Nutch, чтобы индексировать результаты сканирования с elasticsearch? Или вы знаете, что уже существует?
вопрос задан: 14 February 2012 13:14
0
ответов

Оценка многозначного поля solr

Если у меня есть документ с многозначным полем в Solr, несколько значений оцениваются независимо или просто объединяются и оцениваются как одно большое поле? Надеюсь, они забили независимо друг от друга. Вот ...
вопрос задан: 13 February 2012 13:39
0
ответов

Одновременное индексирование и поиск в Lucene

Я хочу выполнить поиск с помощью Lucene по индексу. Индекс часто меняется.Поэтому мне нужно сделать что-то для поиска и индексации одновременно. Это веб-приложение на Tomcat. И я хочу использовать ...
вопрос задан: 13 February 2012 06:02
0
ответов

Сортировка по последнему доступу в Lucene / Solr

В моих запросах Solr я хочу отсортировать документы, к которым недавно осуществлялся доступ, в начало («открытые» означают открытые действием пользователя). Никакой другой критерий поиска не имеет для меня веса: из документов с текстом ...
вопрос задан: 12 February 2012 23:35
0
ответов

Извлечение векторов tf-idf с помощью lucene

Я проиндексировал набор документов с помощью lucene. Я также сохранил DocumentTermVector для каждого содержимого документа. Я написал программу и получил вектор частоты термина для каждого документа, но как я могу ...
вопрос задан: 8 February 2012 21:08
0
ответов

Увеличение количества терминов Lucene при построении индекса

Можно ли определить, что определенные термины более важны, чем другие, при создании индекса (а не при его запросе)? Рассмотрим, например, фильтр синонимов: док 1: "это хорошая машина" документ 2: ...
вопрос задан: 6 February 2012 16:51