0
ответов

Как мне объединить два запроса Lucene с помощью ИЛИ?

Я хотел бы выполнить поиск в моем индексе по двум полям, называемым «a» и «b». Мне задают такие запросы, как Фрейд - теории психологии, и я хотел бы выполнить следующий запрос: (a = "Freud" AND b = "theories of ...
вопрос задан: 23 November 2011 17:50
0
ответов

Индекс слияния в Lucene

В основном я новичок в lucene. Я создал индекс, используя 70 документов электронной почты. 41 документ, использованный для создания другого индекса. Я ...
вопрос задан: 21 November 2011 11:32
0
ответов

Solr Частичное и полное соответствие строк

Я пытаюсь разрешить поиск по частичным строкам в Solr, поэтому, если кто-то будет искать «ppopota», он получит тот же результат, что и «hippopotamus». Я читаю документацию вдоль и поперек ...
вопрос задан: 19 November 2011 20:20
0
ответов

Как получить все документы люценового индекса?

Я создал люценовый индекс. Я хотел бы получить все документы, которые только в соответствии с сортировкой полей и без условий поиска!
вопрос задан: 18 November 2011 15:23
0
ответов

Быстрый, построчный эквивалент "grep -n" для структуры каталогов Unix

Я пытаюсь создать веб-интерфейс для поиска в большом количестве огромных конфигурационных файлов (около 60000 файлов, каждый размером от 20 КБайт до 50 МБайт). Эти файлы также ...
вопрос задан: 14 November 2011 16:12
0
ответов

Конфигурация обнаружения сервера Elasticsearch

Я установил сервер ElasticSearch, это я ' m выполняется: $ ./elasticsearch -f {0.18.2} [11698]: инициализация ... загружена [], сайты [] {0.18.2} [11698]: инициализирована {0.18.2} [11698]: запускается ... ...
вопрос задан: 9 November 2011 10:48
0
ответов

PDFBox добавляет пробелы в слова

Когда я пытаюсь извлечь текст из моих файлов PDF, кажется, что между ними вставляются пробелы. слова случайно. Я использую pdfbox-app-1.6.0.jar (последняя версия) в следующем образце файла в разделе "Загрузки" ...
вопрос задан: 31 October 2011 14:06
0
ответов

Имена динамических столбцов с использованием DIH (DataImportHandler)

Есть ли способ создать имена динамических столбцов (как ключ / значение) с использованием значений, возвращаемых из запроса DIH (DataImportHandler)? Например:
вопрос задан: 27 October 2011 14:21
0
ответов

Запрос всех результатов в Lucene IndexSearcher

Я работаю с классом SearchFiles в каталоге contrib / demo в Lucene. Вместо того, чтобы искать результаты в разбитой на страницы форме, я хочу получить все документы, соответствующие запросу. Есть ли способ ...
вопрос задан: 26 October 2011 08:48
0
ответов

Lucene - поиск поля числового значения

хорошо, я искал это в последние два часа с результатами, которые дают только советы, , а не даже один полный код на помощь (как новички узнают, если они не видят некоторые образцы?) у меня есть ...
вопрос задан: 23 October 2011 14:12
0
ответов

как lucene так быстро вычисляет пересечение документов?

Какие внутренние механизмы хранения и поиска позволяют это? Как в мелочах? Например, у меня есть миллион документов, совпадающих с одним термином, и миллион других документов, соответствующих второму термину ...
вопрос задан: 23 October 2011 08:55
0
ответов

Сортировка с многозначным полем в Solr

У меня есть индекс Solr, который хранит цену в многозначном поле для каждого продукта. Мне нужно отсортировать набор результатов по цене, где цена от низкой к высокой и от высокой к низкой. Я пытаюсь использовать сортировку по цене, но она...
вопрос задан: 21 October 2011 12:41
0
ответов

Lucene в Android

Я новичок в Android и Lucene. я могу использовать Lucene для поиска в представлении списка Android. Я попытался импортировать пакет 2.3.2, а также использовал файлы jar в библиотеке. Тем не менее, есть ошибка в ...
вопрос задан: 19 October 2011 13:41
0
ответов

Как индексировать исходный код с помощью ElasticSearch

Мне нужно обеспечить полнотекстовый поиск по исходным файлам javascript и выделение результатов. У меня вопрос: какая комбинация существующих токенизаторов и анализаторов ElasticSearch лучше всего подходит для этого?
вопрос задан: 17 October 2011 17:18
0
ответов

В чем разница между Solr 1.4 и Solr 3.4

в основном рекомендуется загрузить apache-solr 1.4.1 с http://mirror.lividpenguin.com/pub/apache//lucene/solr/, подскажите, пожалуйста, разница между solr-1.4.1 и 3.4.0? какой я должен использовать? ...
вопрос задан: 10 October 2011 08:10
0
ответов

Поиск по нескольким индексам в Lucene.Net

У меня есть несколько индексов lucene.net, по которым мне нужно искать строку запроса. Так нужно ли мне открывать новый IndexSearcher для всех этих индексов, или я могу добиться этого с помощью одного IndexSearcher? ...
вопрос задан: 6 October 2011 17:00
0
ответов

Lucene.net range queries + highlighting

Еще один вопрос по Lucene.net от новичка. На этот раз я обнаружил интересную проблему с использованием запроса, содержащего диапазон и подсветку. Я пишу это из ...
вопрос задан: 5 October 2011 15:35
0
ответов

Точность отзыва в lucene java

Я хочу использовать Lucene для вычисления точности и отзыва. Я сделал следующие шаги: Сделал несколько индексных файлов. Для этого я использовал код индексатора и проиндексированные файлы .txt, которые существуют по этому пути C: / inn (их 4 ...
вопрос задан: 4 October 2011 08:23
0
ответов

Lucene-подобный поиск по объектам JSON в JavaScript

У меня есть довольно большой массив объектов JSON (это музыкальная библиотека с такими свойствами, как исполнитель, альбом и т. Д., Загрузка jqgrid с loadonce = true), и я хочу реализовать lucene-like (google-like) query ...
вопрос задан: 23 September 2011 17:03
0
ответов

Лучший способ сохранить индекс в реальном времени?

У меня есть индексный файл Solr / Lucene размером примерно 700 Гб. Документы, которые мне нужно проиндексировать, читаются в режиме реального времени, примерно 1000 документов отправляются каждые 30 минут и нуждаются в индексировании. В моем ...
вопрос задан: 15 September 2011 17:05
0
ответов

Как оптимизировать индекс solr

Как оптимизировать solr показатель. Я хочу оптимизировать индексирование solr, так как я пытаюсь изменить его в solrconfig.xml, чтобы он индексировался, но я хочу узнать, как проверить, что они оптимизированы и с чем связаны ...
вопрос задан: 15 September 2011 16:36
0
ответов

Каков самый простой способ реализовать анализ ассоциаций терминов в Solr?

Анализ ассоциаций, кажется, дает хорошие результаты для извлечения связанных терминов в текстовых корпусах. На эту тему есть несколько работ, в том числе известный метод LSA. Самый простой способ добыть ...
вопрос задан: 12 September 2011 20:53
0
ответов

Изменение цвета плотностных графиков в ggplot2

У меня есть целая пара функций плотности вероятности, созданных с помощью ggplot2 следующим образом: требуется (ggplot2) set.seed (2) data < - rbind (data.frame (type = «a», lr = rnorm (100)), data.frame (type = «b», lr =...
вопрос задан: 9 September 2011 15:15
0
ответов

Изменение динамически Elasticsearch SynoMys

Можно ли хранить синонимы для Elasticsearch в индексе? Или можно ли получить список синонимов из базы данных, такую ​​как CouchDB? Я хотел бы добавить синонимы динамически для Elasticsearch через ...
вопрос задан: 2 September 2011 07:40
0
ответов

SOLR: сочетание edgengramfilteractory и ngramfilteractory

У меня есть ситуация, когда мне нужно использовать как edgengramfilteractoractory, так и ngramfilteractory. Я использую NGRAMFILTERFORTORY, чтобы выполнить поиск стиля «Содержит» с минимальным количеством символов как 2. I ...
вопрос задан: 31 August 2011 05:02
0
ответов

Исключение Solr в stats.field?

Можно пометить определенные фильтры и исключить эти фильтры при фасетировании. Обычно это требуется при фасетировании с множественным выбором. Возможно ли что-то подобное для stats.field? stats.field = {! ex = ...
вопрос задан: 30 August 2011 07:24
0
ответов

Запрос Solr не анализируется прямая косая черта

Является ли косая черта "/" зарезервированным символом в именах полей solr? У меня проблемы с написанием запроса сортировки solr, который будет анализировать поля, содержащие косую черту "/" При выполнении http-запроса ...
вопрос задан: 29 August 2011 06:16
0
ответов

Speeding up Solr Indexing

I am kind of working on speeding up my Solr Indexing speed. I just want to know by default how many threads(if any) does Solr use for indexing. Is there a way to increase/decrease that number.
вопрос задан: 24 August 2011 15:33
0
ответов

Искать большие объемы постоянно обновляемого текста в mysql

У меня есть база данных mysql, куда постоянно добавляются большие объемы текста. (10 страниц текста в час). Текст хранится в виде обычного текста в текстовых полях. Каждая строка связывается с одной или двумя страницами текста. Мне нужно ...
вопрос задан: 23 August 2011 16:42
0
ответов

Как индексировать и искать текстовые файлы в Lucene 3.0.2?

Я новичок в Lucene, и у меня возникли проблемы создание простого кода для запроса коллекции текстовых файлов. Я пробовал этот пример, но он несовместим с новой версией Lucene. UDPATE: Это мой ...
вопрос задан: 8 August 2011 22:11