0
ответов

Как лучше всего реализовать полнотекстовый поиск для Google App Engine Java

Как лучше всего реализовать полнотекстовый поиск для Google App Engine Java? Solr не работает из коробки У поискового движка на основе Lucene есть ограничение на размер индекса. последний поиск не ...
вопрос задан: 5 August 2011 03:34
0
ответов

Solandra vs. ElasticSearch

Мы работаем с базой данных Cassandra, которая будет хранить данные в диапазоне петабайт. Мы думаем об использовании либо ElasticSearch, либо Solandra, но мы весело проводим время, выбирая между которыми…
вопрос задан: 5 August 2011 03:09
0
ответов

Lucene - правильный ли ответ для огромного индекса?

Способна ли Lucene индексировать 500 миллионов текстовых документов по 50 КБ каждый? Какую производительность можно ожидать от такого индекса при поиске по одному запросу и поиску по 10 словам? Стоит ли мне волноваться и сразу перейти к ...
вопрос задан: 3 August 2011 07:32
0
ответов

Структурированная и неструктурированная индексация - Lucene и Hbase

У меня есть набор из 200 миллионов документов, которые мне нужно проиндексировать. Каждый документ имеет свободный текст и дополнительный набор разреженных метаданных (более 100 столбцов). Кажется, что правильный инструмент для произвольной индексации
вопрос задан: 1 August 2011 07:08
0
ответов

Compass Lucene hits

Я использую Lucene и Compass, и у меня проблема: попробуйте {CompassHits hits = compassQuery.hits (); for (CompassHit compassHit: hits) {if (results.size ()> = ...
вопрос задан: 27 July 2011 17:07
0
ответов

Solr: Каковы преимущества нормализации длины / omitNorms = false?

Мы используем Solr для поиска статей различной длины. Мы индексируем как описательные метаданные (название, автор, категорию, ключевые слова и т. Д.), Так и полный текст статьи. Мы не повышаем релевантность во время индексации ...
вопрос задан: 26 July 2011 13:33
0
ответов

Lucene или Mysql Полнотекстовый поиск [закрыто]

В настоящее время при запуске проекта веб-приложения или мобильного приложения, в котором поиск будет важной переменной. Лучше выбрать Lucene с самого начала или быстро развернуть решение на основе MySQL и надеяться ...
вопрос задан: 25 July 2011 18:21
0
ответов

Lucene: сравнить результаты по запросам

Мне нужно сравнить релевантность результатов поиска по различным запросам Lucene. На самом деле у меня есть проиндексированный набор текстовых документов, и когда поиск выполняется по этому набору, я хочу возвращать не ...
вопрос задан: 24 July 2011 08:13
0
ответов

Какую хорошую библиотеку Java можно использовать для поиска в нескольких файлах списка условий поиска? [closed]

По сути, я бы хотел поискать в папке и ее подпапках список условий поиска. Он не должен быть сильно оптимизирован или что-то в этом роде. Я бы хотел, чтобы библиотека была ...
вопрос задан: 20 July 2011 15:01
0
ответов

Дескрипторы файлов моего java-процесса становятся «плохими», и я не знаю, почему

у меня java webapp, созданный с помощью Lucene, и я продолжаю получать различные исключения «файл уже закрыт» - в зависимости от того, какую реализацию Directory я использую. Мне удалось получить "java.io.IOException ...
вопрос задан: 12 July 2011 20:14
0
ответов

Lucene, пространственная точность

Я следую примеру из «Lucene в действии», страницы 308–315, который описывает Lucene Spatial. Я использую lucene 2.9.4. Я использовал конечную точку http://geocoder.us/service/distance для расчета расстояния ...
вопрос задан: 12 July 2011 17:52
0
ответов

solrj: как сохранять и извлекать список через многозначное поле в индексе

Мой вариант использования - это индекс, который содержит заголовки онлайн-медиа. Поставщик данных связывает список категорий с каждым заголовком. Я использую SolrJ для заполнения индекса через аннотированный POJO ...
вопрос задан: 9 July 2011 08:31
0
ответов

Java lucene custom analyzer and tokenizer создает проблему в смещениях termvector?

у меня возникла проблема с lucene смещениями termvector, когда я проанализировал поле с помощью моего пользовательского анализатора. даст недопустимые смещения для termvector, но это нормально со стандартным анализатором, здесь ...
вопрос задан: 4 July 2011 07:52
0
ответов

Внедрение Lucene на существующем стеке .NET / SQL Server с несколькими веб-серверами

Я хочу рассмотреть возможность использования Lucene для решения полнотекстового поиска для сайта, которым я сейчас управляю. Сайт полностью построен на технологиях SQL Server 2008 / C # .NET 4. Данные, которые я хочу проиндексировать ...
вопрос задан: 30 June 2011 09:04
0
ответов

{Фильтрация} выполняется быстрее, чем {Query} в Lucene?

Читая "Lucene in Action 2nd edition", я наткнулся на описание классов фильтров, которые могут использоваться для фильтрации результатов в Lucene. В Lucene есть множество фильтров, повторяющих классы запросов ....
вопрос задан: 24 June 2011 01:37
0
ответов

Получение максимального значения поля в solr

Я бы хотел увеличить свой запрос на количество просмотров элемента; Я бы хотел использовать что-то вроде view_count / max_view_count для этой цели, чтобы иметь возможность измерить, как количество просмотров элемента соотносится с самым большим ...
вопрос задан: 20 June 2011 23:32
0
ответов

Как использовать анализатор Lucene для токенизации строки?

Есть ли простой способ использовать любой подкласс анализатора Lucene для синтаксического анализа / токенизации строки? Что-то вроде: String to_be_parsed = "окно машины семь"; Analyzer analyzer = новый StandardAnalyzer (...) ...
вопрос задан: 13 June 2011 18:43
0
ответов

Как улучшить производительность Lucene в распределенной среде?

У меня слишком много времени поиска (порядка 10 секунд) при поиске на мастер-шард реализации в распределенной среде. Однако тот же запрос через Люка возвращается через миллисекунды. The ...
вопрос задан: 4 June 2011 20:22
0
ответов

Система поиска по ключевым словам, которая возвращает статистику вместо обращений

Первый пост на StackOverflow, но я всегда смотрел на этот сайт как на отличный источник общих знаний, и я очень рад видеть, что вытекает из этого вопроса. Насколько я понимаю, теперь я добрался до ...
вопрос задан: 25 May 2011 15:55
0
ответов

Как войти в систему с помощью OFFLINE_ACCESS, используя новый Facebook PHP SDK 3.0.0?

со старым (2.x) SDK Я использовал это, чтобы зарегистрировать кого-то с помощью offline_access: $ session = array и написали преобразователь значений для преобразования строки в TimeSpan. Если в текстовое поле ввести не число, я бы ...
вопрос задан: 25 May 2011 14:07
0
ответов

Каковы плюсы и минусы Solr и ElasticSearch?

И Solr, и ElasticSearch построены на Lucene. Как они соотносятся друг с другом с точки зрения: функций (в частности, многоязычной поддержки и аспектов) Спектакль Масштабируемость Стабильность ...
вопрос задан: 24 May 2011 06:55
0
ответов

Как упорядочить результаты поиска по релевантности и другому полю в Lucene. net

У меня есть требование сортировать результаты поиска по релевантности и другому полю. Мне нужно сделать что-то подобное: используя Lucene.Net.Search; SortField [] fields = new [] {SortField.SCORE, new ...
вопрос задан: 20 May 2011 16:41
0
ответов

Вставка значений в логические поля Solr

Я пытаюсь вставить значение в логическое поле в solr, передавая это как поле в документе, таким образом: значение здесь
вопрос задан: 19 May 2011 09:01
0
ответов

Структура данных для сопоставления с образцом для больших данных

История проблемы У меня ограниченный словарь, содержащий, скажем, 10 символы [AJ]. Что означают эти символы, не имеет отношения к вопросу. Это могут быть основания ДНК, фонемы, слова и т. Д. Предмет - это ...
вопрос задан: 10 May 2011 19:40
0
ответов

Безопасность потоков Lucene IndexWriter

Lucene поощряет повторное использование IndexWriter из нескольких потоков. Учитывая, что два потока могут иметь ссылку на IndexWriter, если поток A закроет писатель, поток B останется ...
вопрос задан: 6 May 2011 08:46
0
ответов

Lucene index backup

What is the best practice to backup a lucene index without taking the index offline (hot backup)?
вопрос задан: 5 May 2011 12:39
0
ответов

Поиск документов по частичным словам

Я ищу систему поиска документов (например, Xapian, Whoosh, Lucene, Solr, Sphinx или другие) ), который может искать частичные термины. Например, при поиске по запросу "brit" поиск ...
вопрос задан: 26 April 2011 19:02
0
ответов

Поисковая машина Lucene против поиска в базе данных

Я использую базу данных MySQL и использую поиск, управляемый базой данных. Какие преимущества и недостатки движков баз данных и поисковой системы Lucene? Я хотел бы получить предложения о том, когда и ...
вопрос задан: 24 April 2011 19:35
0
ответов

Как увеличить смещение позиции в индексе lucene, чтобы оно соответствовало тегам

?

Я использую Lucene 3.0. 3. Готовясь к использованию SpanQuery и PhraseQuery, я хотел бы отметить границы абзацев в своем индексе таким образом, чтобы эти запросы не соответствовали друг другу ...
вопрос задан: 21 April 2011 20:46
0
ответов

Lucene: termFreqVector всегда равен нулю?

для любого документа termFreqVector всегда равен нулю. Я уверен, что документы есть в коллекции и поле существует. Так в чем же проблема? for (int i = 0; i
вопрос задан: 21 April 2011 08:57