lucene - список вопросов по программированию lucene

0

ответов

Исключение Solr часто возникает на сервере org.mortbay.jetty.EofException java.net.SocketException: Broken pipe

это исключение часто возникает, когда система вставляет новую запись db и обновляет индекс solr, есть ли у кого-нибудь такое же проблема ? как этого избежать? 29 марта 2012 г. 18:26:59 org.apache.solr.core....

solr lucene sunspot-solr

вопрос задан: 30 March 2012 01:31

0

ответов

Как восстановить поврежденный индекс Lucene?

На моем сервере произошел сбой питания, и индекс Lucene был поврежден. Я запустил IndexChecker, но он не работает: java -cp /home/dthoai/programs/paesia/checker/lucene-core-3.5.0.jar -ea:org.apache.lucene... org.apache....

lucene

вопрос задан: 29 March 2012 23:41

0

ответов

Сортировка разных групп с использованием разных порядков сортировки в solr

Мы используем solr для создания приложения электронной коммерции, и у нас есть продукты, сгруппированные по подкатегориям в родительской категории. Мы используем порядок динамической сортировки, чтобы определить, к какой категории принадлежит продукт...

grouping search solr sorting lucene

вопрос задан: 28 March 2012 22:50

0

ответов

lucene:повторно открыть indexreader после индекса

, когда мой поисковый сервер начнет работать, он загрузит весь индекс сразу для всех запросов. Однако он по-прежнему использует старый индекс, даже если я перестрою индекс. Поэтому я думаю, что я должен сообщить...

lucene

вопрос задан: 27 March 2012 08:06

0

ответов

Индексирование Neo4j (с Lucene)-Хороший способ упорядочить «типы» узлов?

На самом деле это скорее вопрос Lucene, но в контексте базы данных neo4j. У меня есть база данных, которая разделена примерно на 50 типов узлов (, так что «коллекции» или «таблицы» в других типах…

indexing java neo4j lucene

вопрос задан: 26 March 2012 20:39

0

ответов

Lucene: как увеличить какое-то конкретное поле

В моем случае документы имеют два поля, например, "название" и "просмотры" ". «Просмотры» представляют количество раз, когда люди посещали этот документ. например: «название»: «iphone», «просмотры»: «10». У меня есть...

search-engine lucene

вопрос задан: 22 March 2012 19:27

0

ответов

Сравнение MultiSearcher от Lucene и IndexSearcher с MultiReader

Я собираюсь написать приложение для поиска почти в реальном времени с распределенными индексами. Теперь мне интересно, каков правильный подход к реализации поиска по нескольким индексам: я читал о ...

java search lucene

вопрос задан: 22 March 2012 11:08

0

ответов

Может ли solr возвращать значения функции (не solr score или поля документа)?

Мы делаем запрос solr, в котором мы задаем пользовательскую функцию (которая довольно сложна) и сортируем результаты по значению этой функции. Запрос выглядит примерно так: solr/select?customFunc=...

search solr solrj lucene

вопрос задан: 22 March 2012 10:49

0

ответов

Как реализовать поиск значений int в поиске в спящем режиме?

Я пытаюсь выполнить поиск целочисленного значения. Я аннотировал параметр с помощью @Field следующим образом: @Field (name = "confirmedCount", index = UN_TOKENIZED, store = Store.YES) public int ...

hibernate-search java lucene luke

вопрос задан: 20 March 2012 14:23

0

ответов

Lucene: как получить оценку документа

Я хочу вывести оценку документов. Я пишу для этого следующий код: IndexReader reader = IndexReader.open(FSDirectory.open(indexDir)); Искатель IndexSearcher = новый IndexSearcher(читатель); ...

lucene

вопрос задан: 19 March 2012 13:52

0

ответов

NHibernate Search — несколько веб-серверов

Я использую сборку NHibernate.Search и ищу передовой опыт использования ее с несколькими веб-серверами. У нас достаточно места на наших веб-серверах для обработки индексов, которые мы...

.net c# lucene nhibernate lucene.net

вопрос задан: 17 March 2012 21:32

0

ответов

Что является лучшим выбором для индексации логического значения в lucene?

Индексирование логического значения (true/false) в lucene (не нужно хранить) Я хочу увеличить использование дискового пространства и повысить производительность поиска doc.add(new Field("boolean","true",Field.Store.NO,Field.Index....

java lucene

вопрос задан: 12 March 2012 03:43

0

ответов

отсутствует функция в снимке lucene 4.0

Я пытаюсь использовать версию снимка lucene 4.0, однако StandardAnalyzer отсутствует в этом версия :(. Кто-нибудь знает, как это заменить? В примере кода, приведенном в обзоре Lucene, ...

java lucene

вопрос задан: 7 March 2012 15:22

0

ответов

создать новые основные каталоги в SOLR на the fly

Я использую solr 1.4.1 для построения распределенной поисковой системы, но я не хочу использовать только один индексный файл - я хочу создавать новые основные "index" -директории на лету в моем java-коде. я обнаружил ...

lucene solr distributed solrj

вопрос задан: 7 March 2012 07:30

0

ответов

Как настроить поле, чтобы строка оставалась уникальной в lucene?

Мое приложение создает уникальный идентификатор для каждой строки, индексируемой в lucene и сохраняемой в базе данных. Одна проблема заключается в том, что если есть строка с одинаковым идентификатором, я хочу обновить ее, а не вставлять новую строку и и

lucene uniqueidentifier

вопрос задан: 7 March 2012 02:36

0

ответов

TermQuery не возвращается по известному поисковому запросу, но WildcardQuery возвращает

Я надеюсь, что кто-то, обладающий достаточным пониманием внутренней работы Lucene, сможет указать мне в правильном направлении =) Я пропущу большую часть окружающего

lucene.net sitecore sitecore6 lucene

вопрос задан: 1 March 2012 08:25

0

ответов

Как классифицировать документы, проиндексированные с помощью lucene

Я классифицировал набор документов с помощью Lucene (поля: контент, категория). У каждого документа есть своя собственная категория, но некоторые из них помечены как некатегоризованные. Есть ли способ классифицировать эти ...

java lucene machine-learning classification

вопрос задан: 27 February 2012 07:05

0

ответов

Как мне увидеть / отладить способ, которым SOLR находит результаты?

Допустим, я ищу «ABLS», и SOLR возвращает результат, который для меня не имеет никакого смысла. Как я могу отладить, почему SOLR выбрал эту запись для возврата?

debugging solr lucene

вопрос задан: 23 February 2012 23:26

0

ответов

Zend_Search_Lucene пытается выделить 3503812093817007931 байт

У меня есть около 250 КБ статического HTML-кода, в котором я должен выполнить поиск. Я решил, что для этого воспользуюсь Zend Lucene. Создание индексов занимает несколько секунд, и все хорошо, за исключением случаев, когда я ищу «примерно» ...

php zend-framework search lucene

вопрос задан: 23 February 2012 09:20

0

ответов

Где я могу найти эталоны производительности для Apache Lucene/Solr

Есть ли ссылки/ресурсы на эталоны производительности Lucene/Solr на больших наборах данных. Наборы данных свыше 500 ГБ ~ 5 ТБ Спасибо

solr lucene benchmarking

вопрос задан: 22 February 2012 11:01

0

ответов

Хорошая практика - держать Lucene IndexWriter и IndexSearcher открыт на время существования приложения

В документации Lucene указано, что быстрее всего использовать один экземпляр IndexWriter и IndexSearcher в приложении. На данный момент у меня есть статический экземпляр IndexWriter, открытый в ...

c# java lucene indexing

вопрос задан: 21 February 2012 12:24

0

ответов

Использование CLucene против java lucene

В настоящее время я использую Java lucene для одного из проектов и получаю нормальную производительность. Я ищу вариант C / C ++ для lucene и наткнулся на CLucene на sourceforge. Но я хотел проверить ...

lucene clucene

вопрос задан: 17 February 2012 07:27

0

ответов

как я могу избежать группы специальных символов в java одним методом?

я использую поиск lucene, но lucene имеет набор специальных символов для экранирования, например: - && | | ! () {} [] ^ "~ *?: \ У меня проблема с экранированием этих символов, потому что их слишком много ...

java lucene character

вопрос задан: 17 February 2012 06:26

0

ответов

Улучшение многопоточной индексации с помощью lucene

Я пытаюсь создать свои индексы в Lucene с несколькими потоками. Итак, я начал писать код и написал следующий код. Сначала я нахожу файлы и для каждого файла создаю поток для его индексации. После ...

java multithreading lucene indexing

вопрос задан: 16 February 2012 19:43

0

ответов

Вы индексировали результаты сканирования Nutch раньше с помощью elasticsearch?

Кому-нибудь удавалось писать пользовательские индексаторы для Nutch, чтобы индексировать результаты сканирования с elasticsearch? Или вы знаете, что уже существует?

lucene full-text-search web-crawler nutch elasticsearch

вопрос задан: 14 February 2012 13:14

0

ответов

Оценка многозначного поля solr

Если у меня есть документ с многозначным полем в Solr, несколько значений оцениваются независимо или просто объединяются и оцениваются как одно большое поле? Надеюсь, они забили независимо друг от друга. Вот ...

solr lucene

вопрос задан: 13 February 2012 13:39

0

ответов

Одновременное индексирование и поиск в Lucene

Я хочу выполнить поиск с помощью Lucene по индексу. Индекс часто меняется.Поэтому мне нужно сделать что-то для поиска и индексации одновременно. Это веб-приложение на Tomcat. И я хочу использовать ...

java search tomcat lucene indexing

вопрос задан: 13 February 2012 06:02

0

ответов

Сортировка по последнему доступу в Lucene / Solr

В моих запросах Solr я хочу отсортировать документы, к которым недавно осуществлялся доступ, в начало («открытые» означают открытые действием пользователя). Никакой другой критерий поиска не имеет для меня веса: из документов с текстом ...

solr lucene

вопрос задан: 12 February 2012 23:35

0

ответов

Извлечение векторов tf-idf с помощью lucene

Я проиндексировал набор документов с помощью lucene. Я также сохранил DocumentTermVector для каждого содержимого документа. Я написал программу и получил вектор частоты термина для каждого документа, но как я могу ...

java lucene classification

вопрос задан: 8 February 2012 21:08

0

ответов

Увеличение количества терминов Lucene при построении индекса

Можно ли определить, что определенные термины более важны, чем другие, при создании индекса (а не при его запросе)? Рассмотрим, например, фильтр синонимов: док 1: "это хорошая машина" документ 2: ...

lucene indexing synonym

вопрос задан: 6 February 2012 16:51