Как лучше всего реализовать полнотекстовый поиск для Google App Engine Java? Solr не работает из коробки
У поискового движка на основе Lucene есть ограничение на размер индекса.
последний поиск не ...
Мы работаем с базой данных Cassandra, которая будет хранить данные в диапазоне петабайт. Мы думаем об использовании либо ElasticSearch, либо Solandra, но мы весело проводим время, выбирая между которыми…
Способна ли Lucene индексировать 500 миллионов текстовых документов по 50 КБ каждый? Какую производительность можно ожидать от такого индекса при поиске по одному запросу и поиску по 10 словам? Стоит ли мне волноваться и сразу перейти к ...
У меня есть набор из 200 миллионов документов, которые мне нужно проиндексировать. Каждый документ имеет свободный текст и дополнительный набор разреженных метаданных (более 100 столбцов). Кажется, что правильный инструмент для произвольной индексации
Я использую Lucene и Compass, и у меня проблема: попробуйте {CompassHits hits = compassQuery.hits (); for (CompassHit compassHit: hits) {if (results.size ()> = ...
Мы используем Solr для поиска статей различной длины. Мы индексируем как описательные метаданные (название, автор, категорию, ключевые слова и т. Д.), Так и полный текст статьи. Мы не повышаем релевантность во время индексации ...
В настоящее время при запуске проекта веб-приложения или мобильного приложения, в котором поиск будет важной переменной. Лучше выбрать Lucene с самого начала или быстро развернуть решение на основе MySQL и надеяться ...
Мне нужно сравнить релевантность результатов поиска по различным запросам Lucene. На самом деле у меня есть проиндексированный набор текстовых документов, и когда поиск выполняется по этому набору, я хочу возвращать не ...
По сути, я бы хотел поискать в папке и ее подпапках список условий поиска. Он не должен быть сильно оптимизирован или что-то в этом роде. Я бы хотел, чтобы библиотека была ...
у меня java webapp, созданный с помощью Lucene, и я продолжаю получать различные исключения «файл уже закрыт» - в зависимости от того, какую реализацию Directory я использую. Мне удалось получить "java.io.IOException ...
Я следую примеру из «Lucene в действии», страницы 308–315, который описывает Lucene Spatial. Я использую lucene 2.9.4. Я использовал конечную точку http://geocoder.us/service/distance для расчета расстояния ...
Мой вариант использования - это индекс, который содержит заголовки онлайн-медиа. Поставщик данных связывает список категорий с каждым заголовком. Я использую SolrJ для заполнения индекса через аннотированный POJO ...
у меня возникла проблема с lucene смещениями termvector, когда я проанализировал поле с помощью моего пользовательского анализатора. даст недопустимые смещения для termvector, но это нормально со стандартным анализатором, здесь ...
Я хочу рассмотреть возможность использования Lucene для решения полнотекстового поиска для сайта, которым я сейчас управляю. Сайт полностью построен на технологиях SQL Server 2008 / C # .NET 4. Данные, которые я хочу проиндексировать ...
Читая "Lucene in Action 2nd edition", я наткнулся на описание классов фильтров, которые могут использоваться для фильтрации результатов в Lucene. В Lucene есть множество фильтров, повторяющих классы запросов ....
Я бы хотел увеличить свой запрос на количество просмотров элемента; Я бы хотел использовать что-то вроде view_count / max_view_count для этой цели, чтобы иметь возможность измерить, как количество просмотров элемента соотносится с самым большим ...
Есть ли простой способ использовать любой подкласс анализатора Lucene для синтаксического анализа / токенизации строки? Что-то вроде: String to_be_parsed = "окно машины семь";
Analyzer analyzer = новый StandardAnalyzer (...) ...
У меня слишком много времени поиска (порядка 10 секунд) при поиске на мастер-шард реализации в распределенной среде. Однако тот же запрос через Люка возвращается через миллисекунды. The ...
Первый пост на StackOverflow, но я всегда смотрел на этот сайт как на отличный источник общих знаний, и я очень рад видеть, что вытекает из этого вопроса. Насколько я понимаю, теперь я добрался до ...
со старым (2.x) SDK Я использовал это, чтобы зарегистрировать кого-то с помощью offline_access: $ session = array
и написали преобразователь значений для преобразования строки в TimeSpan. Если в текстовое поле ввести не число, я бы ...
И Solr, и ElasticSearch построены на Lucene. Как они соотносятся друг с другом с точки зрения: функций (в частности, многоязычной поддержки и аспектов)
Спектакль
Масштабируемость
Стабильность
...
У меня есть требование сортировать результаты поиска по релевантности и другому полю. Мне нужно сделать что-то подобное: используя Lucene.Net.Search; SortField [] fields = new [] {SortField.SCORE, new ...
История проблемы У меня ограниченный словарь, содержащий, скажем, 10 символы [AJ]. Что означают эти символы, не имеет отношения к вопросу. Это могут быть основания ДНК, фонемы, слова и т. Д. Предмет - это ...
Lucene поощряет повторное использование IndexWriter из нескольких потоков. Учитывая, что два потока могут иметь ссылку на IndexWriter, если поток A закроет писатель, поток B останется ...
Я ищу систему поиска документов (например, Xapian, Whoosh, Lucene, Solr, Sphinx или другие) ), который может искать частичные термины. Например, при поиске по запросу "brit" поиск ...
Я использую базу данных MySQL и использую поиск, управляемый базой данных. Какие преимущества и недостатки движков баз данных и поисковой системы Lucene? Я хотел бы получить предложения о том, когда и ...
Я использую Lucene 3.0. 3. Готовясь к использованию SpanQuery и PhraseQuery, я хотел бы отметить границы абзацев в своем индексе таким образом, чтобы эти запросы не соответствовали друг другу ...
для любого документа termFreqVector всегда равен нулю.
Я уверен, что документы есть в коллекции и поле существует. Так в чем же проблема? for (int i = 0; i