lucene - список вопросов по программированию lucene

0

ответов

Как лучше всего реализовать полнотекстовый поиск для Google App Engine Java

Как лучше всего реализовать полнотекстовый поиск для Google App Engine Java? Solr не работает из коробки У поискового движка на основе Lucene есть ограничение на размер индекса. последний поиск не ...

вопрос задан: 5 August 2011 03:34

0

ответов

Solandra vs. ElasticSearch

Мы работаем с базой данных Cassandra, которая будет хранить данные в диапазоне петабайт. Мы думаем об использовании либо ElasticSearch, либо Solandra, но мы весело проводим время, выбирая между которыми…

lucene cassandra elasticsearch scalable solandra

вопрос задан: 5 August 2011 03:09

0

ответов

Lucene - правильный ли ответ для огромного индекса?

Способна ли Lucene индексировать 500 миллионов текстовых документов по 50 КБ каждый? Какую производительность можно ожидать от такого индекса при поиске по одному запросу и поиску по 10 словам? Стоит ли мне волноваться и сразу перейти к ...

lucene

вопрос задан: 3 August 2011 07:32

0

ответов

Структурированная и неструктурированная индексация - Lucene и Hbase

У меня есть набор из 200 миллионов документов, которые мне нужно проиндексировать. Каждый документ имеет свободный текст и дополнительный набор разреженных метаданных (более 100 столбцов). Кажется, что правильный инструмент для произвольной индексации

lucene indexing hbase

вопрос задан: 1 August 2011 07:08

0

ответов

Compass Lucene hits

Я использую Lucene и Compass, и у меня проблема: попробуйте {CompassHits hits = compassQuery.hits (); for (CompassHit compassHit: hits) {if (results.size ()> = ...

java lucene compass-lucene

вопрос задан: 27 July 2011 17:07

0

ответов

Solr: Каковы преимущества нормализации длины / omitNorms = false?

Мы используем Solr для поиска статей различной длины. Мы индексируем как описательные метаданные (название, автор, категорию, ключевые слова и т. Д.), Так и полный текст статьи. Мы не повышаем релевантность во время индексации ...

search lucene solr full-text-search solrnet

вопрос задан: 26 July 2011 13:33

0

ответов

Lucene или Mysql Полнотекстовый поиск [закрыто]

В настоящее время при запуске проекта веб-приложения или мобильного приложения, в котором поиск будет важной переменной. Лучше выбрать Lucene с самого начала или быстро развернуть решение на основе MySQL и надеяться ...

search lucene solr full-text-search

вопрос задан: 25 July 2011 18:21

0

ответов

Lucene: сравнить результаты по запросам

Мне нужно сравнить релевантность результатов поиска по различным запросам Lucene. На самом деле у меня есть проиндексированный набор текстовых документов, и когда поиск выполняется по этому набору, я хочу возвращать не ...

java search lucene indexing

вопрос задан: 24 July 2011 08:13

0

ответов

Какую хорошую библиотеку Java можно использовать для поиска в нескольких файлах списка условий поиска? [closed]

По сути, я бы хотел поискать в папке и ее подпапках список условий поиска. Он не должен быть сильно оптимизирован или что-то в этом роде. Я бы хотел, чтобы библиотека была ...

java search lucene full-text-search search-engine

вопрос задан: 20 July 2011 15:01

0

ответов

Дескрипторы файлов моего java-процесса становятся «плохими», и я не знаю, почему

у меня java webapp, созданный с помощью Lucene, и я продолжаю получать различные исключения «файл уже закрыт» - в зависимости от того, какую реализацию Directory я использую. Мне удалось получить "java.io.IOException ...

java linux lucene

вопрос задан: 12 July 2011 20:14

0

ответов

Lucene, пространственная точность

Я следую примеру из «Lucene в действии», страницы 308–315, который описывает Lucene Spatial. Я использую lucene 2.9.4. Я использовал конечную точку http://geocoder.us/service/distance для расчета расстояния ...

java lucene

вопрос задан: 12 July 2011 17:52

0

ответов

solrj: как сохранять и извлекать список через многозначное поле в индексе

Мой вариант использования - это индекс, который содержит заголовки онлайн-медиа. Поставщик данных связывает список категорий с каждым заголовком. Я использую SolrJ для заполнения индекса через аннотированный POJO ...

java lucene solr solrj

вопрос задан: 9 July 2011 08:31

0

ответов

Java lucene custom analyzer and tokenizer создает проблему в смещениях termvector?

у меня возникла проблема с lucene смещениями termvector, когда я проанализировал поле с помощью моего пользовательского анализатора. даст недопустимые смещения для termvector, но это нормально со стандартным анализатором, здесь ...

java lucene analyzer

вопрос задан: 4 July 2011 07:52

0

ответов

Внедрение Lucene на существующем стеке .NET / SQL Server с несколькими веб-серверами

Я хочу рассмотреть возможность использования Lucene для решения полнотекстового поиска для сайта, которым я сейчас управляю. Сайт полностью построен на технологиях SQL Server 2008 / C # .NET 4. Данные, которые я хочу проиндексировать ...

.net sql-server lucene lucene.net

вопрос задан: 30 June 2011 09:04

0

ответов

{Фильтрация} выполняется быстрее, чем {Query} в Lucene?

Читая "Lucene in Action 2nd edition", я наткнулся на описание классов фильтров, которые могут использоваться для фильтрации результатов в Lucene. В Lucene есть множество фильтров, повторяющих классы запросов ....

java lucene

вопрос задан: 24 June 2011 01:37

0

ответов

Получение максимального значения поля в solr

Я бы хотел увеличить свой запрос на количество просмотров элемента; Я бы хотел использовать что-то вроде view_count / max_view_count для этой цели, чтобы иметь возможность измерить, как количество просмотров элемента соотносится с самым большим ...

lucene solr

вопрос задан: 20 June 2011 23:32

0

ответов

Как использовать анализатор Lucene для токенизации строки?

Есть ли простой способ использовать любой подкласс анализатора Lucene для синтаксического анализа / токенизации строки? Что-то вроде: String to_be_parsed = "окно машины семь"; Analyzer analyzer = новый StandardAnalyzer (...) ...

java lucene tokenize analyzer

вопрос задан: 13 June 2011 18:43

0

ответов

Как улучшить производительность Lucene в распределенной среде?

У меня слишком много времени поиска (порядка 10 секунд) при поиске на мастер-шард реализации в распределенной среде. Однако тот же запрос через Люка возвращается через миллисекунды. The ...

performance lucene

вопрос задан: 4 June 2011 20:22

0

ответов

Система поиска по ключевым словам, которая возвращает статистику вместо обращений

Первый пост на StackOverflow, но я всегда смотрел на этот сайт как на отличный источник общих знаний, и я очень рад видеть, что вытекает из этого вопроса. Насколько я понимаю, теперь я добрался до ...

sql database search indexing lucene

вопрос задан: 25 May 2011 15:55

0

ответов

Как войти в систему с помощью OFFLINE_ACCESS, используя новый Facebook PHP SDK 3.0.0?

со старым (2.x) SDK Я использовал это, чтобы зарегистрировать кого-то с помощью offline_access: $ session = array и написали преобразователь значений для преобразования строки в TimeSpan. Если в текстовое поле ввести не число, я бы ...

java lucene full-text-search solr

вопрос задан: 25 May 2011 14:07

0

ответов

Каковы плюсы и минусы Solr и ElasticSearch?

И Solr, и ElasticSearch построены на Lucene. Как они соотносятся друг с другом с точки зрения: функций (в частности, многоязычной поддержки и аспектов) Спектакль Масштабируемость Стабильность ...

lucene full-text-search solr search-engine elasticsearch

вопрос задан: 24 May 2011 06:55

0

ответов

Как упорядочить результаты поиска по релевантности и другому полю в Lucene. net

У меня есть требование сортировать результаты поиска по релевантности и другому полю. Мне нужно сделать что-то подобное: используя Lucene.Net.Search; SortField [] fields = new [] {SortField.SCORE, new ...

.net search .net-3.5 lucene lucene.net

вопрос задан: 20 May 2011 16:41

0

ответов

Вставка значений в логические поля Solr

Я пытаюсь вставить значение в логическое поле в solr, передавая это как поле в документе, таким образом: значение здесь

indexing lucene solr

вопрос задан: 19 May 2011 09:01

0

ответов

Структура данных для сопоставления с образцом для больших данных

История проблемы У меня ограниченный словарь, содержащий, скажем, 10 символы [AJ]. Что означают эти символы, не имеет отношения к вопросу. Это могут быть основания ДНК, фонемы, слова и т. Д. Предмет - это ...

algorithm data-structures hash lucene pattern-matching

вопрос задан: 10 May 2011 19:40

0

ответов

Безопасность потоков Lucene IndexWriter

Lucene поощряет повторное использование IndexWriter из нескольких потоков. Учитывая, что два потока могут иметь ссылку на IndexWriter, если поток A закроет писатель, поток B останется ...

java lucene

вопрос задан: 6 May 2011 08:46

0

ответов

Lucene index backup

What is the best practice to backup a lucene index without taking the index offline (hot backup)?

java lucene

вопрос задан: 5 May 2011 12:39

0

ответов

Поиск документов по частичным словам

Я ищу систему поиска документов (например, Xapian, Whoosh, Lucene, Solr, Sphinx или другие) ), который может искать частичные термины. Например, при поиске по запросу "brit" поиск ...

lucene solr information-retrieval xapian whoosh

вопрос задан: 26 April 2011 19:02

0

ответов

Поисковая машина Lucene против поиска в базе данных

Я использую базу данных MySQL и использую поиск, управляемый базой данных. Какие преимущества и недостатки движков баз данных и поисковой системы Lucene? Я хотел бы получить предложения о том, когда и ...

mysql lucene search-engine

вопрос задан: 24 April 2011 19:35

0

ответов

Как увеличить смещение позиции в индексе lucene, чтобы оно соответствовало тегам
?

Я использую Lucene 3.0. 3. Готовясь к использованию SpanQuery и PhraseQuery, я хотел бы отметить границы абзацев в своем индексе таким образом, чтобы эти запросы не соответствовали друг другу ...

html tags lucene indexing position

вопрос задан: 21 April 2011 20:46

0

ответов

Lucene: termFreqVector всегда равен нулю?

для любого документа termFreqVector всегда равен нулю. Я уверен, что документы есть в коллекции и поле существует. Так в чем же проблема? for (int i = 0; i

java lucene

вопрос задан: 21 April 2011 08:57