0
ответов

Elasticsearch -EdgeNgram + подсветка + термин _вектор = плохие выделения

Когда я использую анализатор с edgengram (min=3, max=7, front )+ term _vector=with _position _offsets С документом, имеющим text = "CouchDB" Когда я ищу "couc" Я выделил "cou", а не "...
вопрос задан: 3 July 2012 02:19
0
ответов

Использование Solr для индексации и поиска с помощью Mongodb и nodejs

Есть ли у кого-нибудь опыт работы с этим конкретным стеком? Я работаю над веб-проектом, который со временем будет содержать очень большой объем данных, и пытался заставить Solr хорошо работать с...
вопрос задан: 27 June 2012 17:42
0
ответов

Найти список терминов, проиндексированных Lucene

Можно ли извлечь список всех терминов в индекс Lucene в виде списка строк? Я не мог найти эту функцию в документе. Спасибо!
вопрос задан: 21 June 2012 23:00
0
ответов

Средство проверки орфографии Solr не возвращает никаких результатов

Я работаю над приложением, которое требует от меня использования Solr в первый раз. Я настроил его, индексируя правильные данные и запрашивая, как мне хотелось бы, но я не могу получить проверку орфографии...
вопрос задан: 19 June 2012 22:23
0
ответов

В чем разница между ANALYZED и ANALYZED_NO_NORMS в Lucene?

Я не мог понять разницу между двумя способами индексации: ANALYZED и ANALYZED_NO_NORMS. Я прочитал Lucene Javadoc, но не понял разницы. Может кто-нибудь рассказать мне больше о ...
вопрос задан: 11 June 2012 17:36
0
ответов

nutch vs solr indexing

Недавно я начал работать над nutch и пытаюсь понять, как он работает. Насколько я знаю, Nutch в основном используется для сканирования веб-страниц, а solr/Lucene — для индексации и поиска. Но когда я...
вопрос задан: 1 June 2012 05:18
0
ответов

Индексируйте базу данных MySQL с помощью Apache Lucene и синхронизируйте их.

Когда в MySQL добавляется новый элемент, он также должен быть проиндексирован Lucene. Когда существующий элемент удаляется из MySQL, он также должен быть удален из индекса Lucene. Идея состоит в том, чтобы написать сценарий, который будет...
вопрос задан: 31 May 2012 09:58
0
ответов

Аспект поискового запроса Solr возвращает только 100 результатов

Я вызываю поиск Solr, размещенный на другом компьютере, с запросом. Когда я написал запрос, он возвращает numFound=2405 соответствующих документов. у нас проиндексировано более 10000 документов. Но результаты аспекта, которые...
вопрос задан: 31 May 2012 06:14
0
ответов

Nutch: чтение данных и добавление метаданных

Недавно я начал искать apache nutch. Я мог настроить и сканировать интересующие меня веб-страницы с помощью nutch. Я не совсем понимаю, как читать эти данные. Я в принципе хочу связать...
вопрос задан: 27 May 2012 06:09
0
ответов

Как выполнить фасетный поиск?

Я хотел бы знать, как выполнить фасетный поиск с помощью lucene.facet. Я объясню, что именно я хочу сделать: у меня есть таксономия html-файлов (похожая на ODP), и я хочу, чтобы по заданному запросу отображалось...
вопрос задан: 21 May 2012 16:45
0
ответов

Токенизация и индексация с помощью Lucene, как справиться с внешней токенизацией и частью речи?

Я хотел бы создать свой собственный — здесь не уверен, какой именно — токенизатор (с точки зрения Lucene) или собственный анализатор. Я уже пишу код, который токенизирует мои документы в слове (в виде списка ...
вопрос задан: 21 May 2012 15:54
0
ответов

Найти все документы Lucene, содержащие определенное поле

Я хочу чтобы найти все документы в индексе, в которых есть определенное поле, независимо от значения поля. Если это вообще возможно, используйте язык запросов, а не API. Есть ли способ?
вопрос задан: 18 May 2012 15:34
0
ответов

Поиск с учетом предложений с помощью Lucene SpanQueries

Можно ли использовать Lucene SpanQuery для поиска всех вхождений, в которых термины «красный», «зеленый» и «синий» встречаются внутри одно предложение? Мой первый (неполный/неправильный) подход - написать...
вопрос задан: 15 May 2012 03:17
0
ответов

Разница между FSDirectory и MMap Directory?

Кто-нибудь может объяснить мне, в чем разница между FSDirectory и MMapDirectory? Я хочу разогреть свой кеш. Я читал, что это может быть полезно, но не мог найти, как это поможет в прогреве...
вопрос задан: 8 May 2012 14:54
0
ответов

org.apache.lucene.index.IndexNotFoundException :нет сегментов *файл не найден в org.apache.lucene.store. RAMDirectory

Я новичок в Java и Lucene. Мой код получает строку из файла и сохраняет ее в индексе Lucene. Но когда я создаю IndexReader для поиска и чтения из индекса, он выдает исключение. Мой код Java...
вопрос задан: 5 May 2012 18:42
0
ответов

Lucene .net Boost не работает при использовании подстановочного знака *

У меня есть два документа, и я использую Luke для исследования, я подтвердил в коде, что он имеет такое же поведение, используя StandardAnalyzer. Задокументируйте один с boost 1, сохраненный/несжатый, индексированный, токенизированный <...
вопрос задан: 2 May 2012 10:29
0
ответов

Как запрашивать целые числа, числа с плавающей запятой в lucene и как хранить (NumericComparator )?

Более важный вопрос, сможет ли solr поддерживать это? Я знаю, что видел, как lucene может это сделать, и solr построен на lucene. Где-то я видел пример с использованием Google, но, кажется, не могу...
вопрос задан: 1 May 2012 23:21
0
ответов

Правильный способ добавления пользовательского параметра запроса в Solr

В настоящее время я использую пару клиент-сервер Solr, которая работает нормально. Однако в некоторых случаях запрос фильтра (параметр fq ), который отправляется в Solr, довольно велик (может содержать тысячи символов )...
вопрос задан: 1 May 2012 16:08
0
ответов

Lucene Highlighter с анализатором основы

Я использую класс Lucene Highlighter для выделения фрагментов совпадающих результатов поиска, и он работает хорошо. Я хотел бы переключиться с поиска с помощью StandardAnalyzer на EnglishAnalyzer, который...
вопрос задан: 26 April 2012 19:10
0
ответов

Иерархическая таксономия в фасетном поиске с использованием RavenDb/Lucene?

Я рассматриваю RavenDb для реализации сценария «расширенного фасетного поиска». Мне приходится иметь дело со сложной иерархической таксономией и общими аспектами в разных ветвях дерева, в то время как...
вопрос задан: 23 April 2012 17:58
0
ответов

Повышают ли производительность несколько сегментов Solr на одном компьютере?

Повышает ли производительность запуск нескольких сегментов Solr на одном компьютере? Я бы ожидал, что Lucene будет многопоточным, но, похоже, он не использует больше одного ядра на моем сервере с 16 ...
вопрос задан: 21 April 2012 17:14
0
ответов

Lucene :исключение -Анализатор запросов обнаружил после «некоторого слова»

Я работаю над проблемой классификации, чтобы классифицировать отзывы о продуктах как положительные, отрицательные или нейтральные согласно данным обучения с использованием Lucene API. Я использую объекты ArrayList of Review -"...
вопрос задан: 21 April 2012 14:41
0
ответов

Кассандра или SOLR? Что дает лучшую производительность для запросов на чтение?

Моя команда попросила меня выбрать между Cassandra и SOLR для более быстрого ответа на запросы с внешней стороны. Я сказал им, что Cassandra — это NOSQL db, а SOLR — индексация. Но потом они говорят, что мы...
вопрос задан: 17 April 2012 17:41
0
ответов

Как выполнять поиск в документе json в apache solr lucene

Ниже приведен образец json, который я импортировал в solr, где идентификатор уникален, а поле документа json _содержит весь json. { "id" :"cust _123", "json _doc" :"{ "\first _name\" :\"xyz\", \"...
вопрос задан: 17 April 2012 12:19
0
ответов

Проблемы с индексом Lucene с символом «-»

У меня проблемы с индексом Lucene, в котором есть проиндексированные слова, содержащие символы «-». Это работает для некоторых слов, содержащих "-", но не для всех, и я не нахожу причину, почему это не так...
вопрос задан: 17 April 2012 07:05
0
ответов

Solr Query -Ошибка HTTP 404 неопределенный текст поля

У меня есть экземпляр Solr, работающий на моем компьютере с Ubuntu, использующий сервер Jetty по умолчанию, с которым идет загрузка Solr. Всякий раз, когда я запускаю Solr с помощью java -jar start.jar, сервер запускается нормально, но...
вопрос задан: 12 April 2012 19:11
0
ответов

Разница между BooleanClause.Occur.Must и BooleanClause.Occur.SHOULD в люцене

Кто-нибудь может объяснить разницу между BooleanClause.Occur.Must и BooleanClause.Occur.SHOULD в lucene в BooleanQuery на примере?
вопрос задан: 12 April 2012 11:34
0
ответов

Почему Solr намного быстрее, чем Postgres?

Недавно я перешел с Postgres на Solr и заметил ускорение наших запросов примерно в 50 раз. Запросы, которые мы запускаем, включают несколько диапазонов, а наши данные — это списки транспортных средств. Например: «Найти все транспортные средства с...
вопрос задан: 7 April 2012 11:32
0
ответов

Запрос Solr: стоп-слова, OR и AND странность

Мы используем Solr 3.5 со схемой со следующим объявлением поля: <...
вопрос задан: 4 April 2012 18:24
0
ответов

Как хранить данные дерева в индексе Lucene/Solr/Elasticsearch или в базе данных NoSQL?

Скажем, вместо документов у меня есть небольшие деревья, которые мне нужно хранить в индексе Lucene. Как мне это сделать? Пример узла в дереве: class Node { Строковые данные; Тип строки; List&...
вопрос задан: 2 April 2012 03:55