0
ответов

What makes a good autowarming query in Solr and how do they work?

This question is a follow up to this question about infrequent, isolated read timeouts in a solr installation. As a possible problem missing / bad autowarming queries for new searchers were found. ...
вопрос задан: 23 May 2017 12:33
0
ответов

Поиск имен с помощью Apache Solr

I ' я только что рискнул войти в кажущийся простым, но чрезвычайно сложный мир поиска. Для приложения я должен создать механизм поиска для поиска пользователей по их именам. Прочитав ...
вопрос задан: 23 May 2017 12:25
0
ответов

Как выполнять поиск «содержит», а не «начинается с» с помощью Lucene.Net

Мы используем Lucene.NET для реализации полнотекстового поиска на веб-сайтах клиентов. Сам поиск уже работает, но теперь мы хотим внести изменения. В настоящее время все термины имеют добавление *, что ведет к ...
вопрос задан: 23 May 2017 12:24
0
ответов

Как узнать частоту многословных терминов в Lucene?

Я использую Lucene, чтобы получить частоту терминов в документах, то есть количество вхождений некоторых терминов в каждый документ. Я использую IndexReader.termDocs () для этой цели, и он отлично работает для однословных ...
вопрос задан: 23 May 2017 12:24
0
ответов

недопустимые символы для текстового поиска lucene

В моем IndexController есть общедоступная функция buildAction () { $ index = Zend_Search_Lucene :: create (APPLICATION_PATH. '/ indexes'); foreach ($ this-> pages as $ p) {$ doc = ...
вопрос задан: 23 May 2017 12:18
0
ответов

Elasticsearch всегда возвращает «тип сопоставления отсутствует»

Я следую приведенному здесь совету, чтобы найти частичные слова с помощью elasticsearch: ElasticSearch n- gram tokenfilter не находит частичные слова Я создал простой сценарий bash, который пытается ...
вопрос задан: 23 May 2017 12:17
0
ответов

В чем разница между запросом с фразой и использованием фильтра shingle?

В настоящее время я индексирую веб-страницу с помощью lucene. Цель состоит в том, чтобы иметь возможность быстро извлечь, какая страница содержит определенное выражение (обычно 1, 2 или 3 слова), а какие другие слова (или группу от 1 до 3 из ...
вопрос задан: 23 May 2017 12:17
0
ответов

Mocking and Unit Testing Solr and Lucene Index

Нам нужен контроль над данными в производственном индексе solr, и нам нужно, чтобы он был совместим с новыми разработками. В идеале мы хотели бы смоделировать индекс на локальных машинах, запросить с его помощью solr и записать модуль ...
вопрос задан: 23 May 2017 12:16
0
ответов

Фасетный поиск Lucene.NET

Я создаю фасетный поиск с Lucene.NET, не используя Solr. Я хочу получить список элементов навигации в текущем запросе. Я просто хочу убедиться, что я указал в правильном направлении. У меня есть ...
вопрос задан: 23 May 2017 12:04
0
ответов

Lucene 3.0.3 не удаляет документ

Мы используем Lucene для индексации некоторых внутренних документов. Иногда нам нужно удалить документы. Эти документы имеют уникальный идентификатор и представлены классом DocItem следующим образом (ВСЕ КОДЫ УПРОЩЕННЫ ...
вопрос задан: 23 May 2017 12:04
0
ответов

Начало работы с Solr

Я пытаюсь начать работу с Apache Solr, но некоторые вещи мне не ясны. Прочитав учебник, я установил работающий экземпляр Solr. Меня смущает то, что вся конфигурация ...
вопрос задан: 23 May 2017 12:03
0
ответов

Извлечение/опознание сущностей с помощью бесплатных инструментов при питании Lucene Index

В настоящее время я исследую возможности извлечения имен людей, мест их нахождения, технических слов и категорий из текста (много статей из сети), который затем будет введен в индекс Lucene/ElasticSearch. ...
вопрос задан: 23 May 2017 12:00
0
ответов

Создание облака тегов с SOLR

Уважаемое сообщество Stackoverflow: Учитывая какой-нибудь текст, я хочу получить лучшие 50 самых частых слов в тексте и создавать облако тегов, и, таким образом, показать суть того, что Текст о ...
вопрос задан: 23 May 2017 11:59
0
ответов

Резервное копирование горячего индекса Lucene с использованием IndexReader вместо IndexWriter / SnapshotDeletionPolicy

Приемлемы ли следующие строки кода для получить горячее резервное копирование индекса Lucene или выполнить IndexWriter / SnapshotDeletionPolicy, как описано в разделе Резервное копирование индекса Lucene? Каталог dir = ...; ...
вопрос задан: 23 May 2017 10:34
0
ответов

Lucene 2.9.2: Как отображать результаты в случайном порядке?

По умолчанию Lucene возвращает результаты запроса в порядке релевантности (оценки). Вы можете передать поле сортировки (или несколько), тогда результаты будут отсортированы по этому полю. Сейчас я ищу хороший ...
вопрос задан: 23 May 2017 10:28
0
ответов

Запрос Solr через Solrj :Основы

Я пытаюсь запросить Solr через Solrj в Eclipse. Я попробовал последний пример вики solrj :import org.apache.solr.client.solrj.SolrServer; импортировать org.apache.solr.client.solrj.SolrServerException;...
вопрос задан: 27 April 2017 13:30
0
ответов

Пользователь Mac - Как установить КЛАССЫ на Mac (я работаю над демонстрацией Lucene)

Я пытаюсь заставить работать свою демонстрацию Apache Lucene, и я собираюсь установить путь к классам в этом руководстве http://lucene.apache.org/ java / 2_3_2 / demo.html Я поискал в Интернете и нашел два решения ...
вопрос задан: 16 April 2017 13:05
0
ответов

Какой проект с открытым исходным кодом для полнотекстового поиска является лучшим (предпочтительно .NET)?

Я разработал приложение для индексации и поиска с библиотекой Lucene. но у этой библиотеки есть некоторые ограничения в настраиваемом ранжировании в моем контексте, помимо производительности, мне нужна масштабируемость и доступ к ...
вопрос задан: 4 April 2017 09:45
0
ответов

Elasticsearch - объединение query_string и bool запроса в фильтре

Можно ли объединить query_string и bool в запросе фильтра? Например - {"filter": {"query_string": {"query": "field: text"}}, "bool": {"should": {"...
вопрос задан: 12 December 2016 20:06
0
ответов

elasticsearch / lucene highlight

Я использую ElasticSearch для индексации документов. Мое отображение: "mongodocid": {"boost": 1.0, "store": "yes", "type": "string" }, «fulltext»: {«boost»: 1.0, «index»: «проанализировано», «store»: «...
вопрос задан: 1 December 2016 08:48
0
ответов

Как заставить QueryParser в Lucene обрабатывать числовые диапазоны?

new QueryParser (....) .parse (somequery); он работает только для полей с строковым индексом. Скажем, у меня есть поле с именем count, где count - целочисленное поле (при индексировании поля я считал тип данных) ...
вопрос задан: 10 October 2016 13:03
0
ответов

Как разобрать / распаковать / распаковать индексы репозитория Maven, сгенерированные Nexus

Я загрузил индексы, созданные для Maven Central, с http://mirrors.ibiblio.org/pub /mirrors/maven2/dot-index/nexus-maven-repository-index.gz Я хотел бы перечислить информацию об артефактах ...
вопрос задан: 10 May 2016 18:02
0
ответов

Лучший способ отфильтровать поля, хранящиеся в удаленной базе данных в solr / lucene?

У меня индекс около 100k документы, представляющие объект фильма. Пользователи могут помещать фильмы в различные списки (например, избранное и т. Д.). Эти списки хранятся в базе данных mysql и не индексируются в ...
вопрос задан: 13 February 2016 10:45
0
ответов

Многоязычный поиск Использование Lucene

Я делаю многоязычный поиск. И я буду использовать Lucene в качестве инструмента для этого. У меня уже есть переведенное содержимое, там будет 3 или 4 языка каждого документа. Для индексации и поиска, там ...
вопрос задан: 5 January 2016 22:19
0
ответов

Нечеткий поиск Lucene по именам клиентов и частичному адресу

Я просматривал все существующие сообщения с вопросами, но не смог найти что-то очень важное. У меня есть файл с миллионами записей для имени, фамилии, адреса1, адреса2, кода страны, ...
вопрос задан: 29 October 2015 06:29
0
ответов

Какой смысл иметь частные конструкторы, если вы можете получить к ним доступ с помощью отражения?

и, возможно, частный статический метод и свойства и т. Д.
вопрос задан: 24 June 2015 02:30
0
ответов

Как получить объяснение Lucene для SolrDocument с помощью Solrj?

Я ищу в индексе Solr с помощью SolrJ и пытаюсь получить объяснение Lucene для записи его в журнал для дальнейшего использования. Код выглядит так: SolrServer server = new CommonsHttpSolrServer ("solr_url"); ...
вопрос задан: 17 June 2015 04:56
0
ответов

Как индексировать поле даты в люцене

Я новичок в люцене. Мне нужно проиндексировать поле даты. Я использую следующий конструктор IndexWriter в lucene 3.0.0. IndexWriter writer = новый IndexWriter (FSDirectory.open (indexDir), new WhitespaceAnalyzer (), ...
вопрос задан: 13 May 2015 16:22
0
ответов

В Lucene, почему мои увеличенные и не увеличенные документы получают одинаковый результат?

В индексное время я увеличиваю определенный документ таким образом: if (myCondition) { document.SetBoost(1.2f); } Но в поисковом времени документы со всеми теми же качествами, но некоторые проходят, а некоторые ...
вопрос задан: 23 April 2015 17:36
0
ответов

Поиск по имени файла с ElasticSearch

Я хочу использовать ElasticSearch для поиска имен файлов (а не содержимого файла). Поэтому мне нужно найти часть имени файла (точное совпадение, нечеткий поиск). Пример: у меня есть файлы со следующим ...
вопрос задан: 8 October 2014 07:39