0
ответов

Использование комбинации подстановочных знаков и оснований

Я использую анализатор снежного кома для определения заголовков нескольких документов. Все работает хорошо, но есть свои особенности. Пример: поиск по запросу «клапан», «клапан» или «клапаны» возвращает одно и то же число ...
вопрос задан: 1 February 2012 21:17
0
ответов

Запрос Solr с предложением LIKE

Я работаю с Solr и хотел бы знать, возможно ли использование предложения LIKE в запросе. Например, я хочу знать все организации, в названии которых есть «Нью-Йорк». В SQL это будет ...
вопрос задан: 1 February 2012 15:43
0
ответов

Как повысить поля в solr

Я уже заранее определил усиление. У меня есть поле в индексе solr под названием boost1. Это поле повышения будет иметь значение от 1 до 10, аналогичное рейтингу Google PR. Это усиление, которое ...
вопрос задан: 1 February 2012 15:41
0
ответов

Как данные хранятся в lucene

Я знаю, что lucene создает индекс и хранит все данные. Может ли кто-нибудь сказать мне, как данные хранятся в плоском файле? Или какие алгоритмы они используют для хранения данных в бэкенде, чтобы они могли ...
вопрос задан: 1 February 2012 13:32
0
ответов

Минимизация количества файлов в индексе Lucene

У меня есть специфическое приложение, которое требует, чтобы количество файлов, составляющих индекс, было как можно меньше. Раньше, когда я использовал Lucene.NET 2.9.2, я мог держать весь индекс в 3 (или 4) ...
вопрос задан: 1 February 2012 12:43
0
ответов

Могу ли я изменить оценку в зависимости от позиции термина в Lucene?

например, если я ищу в указателе названий книг с термином «harry» , «Грязный Гарри» оценивается одинаково, как «Гарри Поттер», а когда два предмета имеют одинаковую оценку, порядок выбирается случайным образом. Я бы хотел ...
вопрос задан: 31 January 2012 22:49
0
ответов

Lucene: Многословные фразы в качестве условий поиска

Я пытаюсь сделать каталог телефонов/местных предприятий с возможностью поиска, используя Apache Lucene. У меня есть поля для названия улицы, названия предприятия, номера телефона и т.д. Проблема заключается в том, что когда я пытаюсь ...
вопрос задан: 30 January 2012 15:31
0
ответов

mg4j vs. apache lucene

Может ли кто-нибудь провести простой сравнительный анализ этих поисковых систем? Какие преимущества у обоих фреймворков? Кстати, я видел следующие основные объяснения выбора mg4j из нескольких ...
вопрос задан: 27 January 2012 15:57
0
ответов

Как получить список уникальных терминов из определенного поля в Lucene?

У меня есть индекс из большого корпуса с несколькими полями. Только одно из этих полей содержит текст. Мне нужно извлечь уникальные слова из всего индекса на основе этого поля. Кто-нибудь знает, как я могу сделать ...
вопрос задан: 18 January 2012 12:19
0
ответов

Как использовать Lucene и JPA?

Я хотел бы использовать Lucene для обеспечения возможности полнотекстового поиска по некоторым из моих java-объектов, хранящихся с EclipseLink в моей базе данных Postgresql. Я видел, что Hibernate имеет интегрированное решение для Lucene ...
вопрос задан: 16 January 2012 15:04
0
ответов

lucene good practice and thread safety

Я использую lucene для индексирования документов и выполнения поиска, после которого я немедленно удаляю их. все это можно рассматривать как несколько атомарное действие, включающее следующие шаги: index (...
вопрос задан: 16 January 2012 10:52
0
ответов

Как использовать MultiFieldQueryParser из Lucene?

Я использую Version.Lucene_29. Используя обычный метод строкового запроса, я мог сделать следующее: Directory directory = new FSDirectory (...); // Запускаем получение Lucene. IndexSearcher iSearch = new ...
вопрос задан: 13 January 2012 00:47
0
ответов

Grails запрос подключаемого модуля с возможностью поиска

Приложение My Grails использует подключаемый модуль с возможностью поиска, который основан на Compass и Lucene для обеспечения функциональности поиска. У меня есть два класса с возможностью поиска, например, «Автор» и «Книга». Я сопоставил эти классы с .
вопрос задан: 12 January 2012 09:50
0
ответов

JVM постоянно дает сбой во время индексирования lucene

JVM постоянно дает сбой. Я не могу понять, в чем проблема. Я тестировал последнюю версию 1.6 jdk, а также 1.7. Та же проблема. Я выполнил проверку памяти, и ошибок не было. Я ...
вопрос задан: 11 January 2012 15:33
0
ответов

какова лучшая настройка lucene для ранжирования точных совпадений как наивысших

Какие анализаторы следует использовать для индексации и поиска, когда я хочу, чтобы точное совпадение оценивалось выше, чем "частичное " соответствие? Возможно, настроить индивидуальную оценку в классе подобия? Например, когда ...
вопрос задан: 9 January 2012 09:47
0
ответов

сколько дополнительного пространства/RAM/CPU использует apache solr?

Я использую базу данных MySQL для своего webapp. Мне нужен поиск по нескольким таблицам и нескольким столбцам, это очень похоже на полнотекстовый поиск в этих столбцах. Мне нужно знать ваш опыт в ...
вопрос задан: 3 January 2012 10:23
0
ответов

Как написать запрос solr для получения всех записей с числовым значением поля меньше указанного?

Предположим, у нас есть набор mp3-плееров с именами и ценами. Как написать правильный поисковый запрос для поиска всех товаров с определенным названием и ценой менее 100 $? q = "(name: (ipod) AND ...
вопрос задан: 30 December 2011 11:15
0
ответов

Есть ли способ для Solr / Lucene вернуть ранги выбранных документов вместо полных результатов?

Меня интересует запрос к Solr с запросом q и отображение его отзыва для набора документов D, когда возвращаются документы {10, 20, 30, ...}. В настоящее время у меня есть полные результаты, то есть список ...
вопрос задан: 20 December 2011 22:51
0
ответов

в чем разница между группировкой и фасетом в lucene 3.5

Я обнаружил в папке contrib lucene 3.5 два плагина: один группирует, другой фасет. В моем варианте оба они использовались для разделения моих документов на разные категории. Почему у lucene теперь два ...
вопрос задан: 18 December 2011 11:10
0
ответов

Можно ли скомпилировать и использовать xapian, clucene или lucy на iOS?

Я хочу скомпилировать и использовать Xapian с xcode на iOS, есть ли кто-нибудь, кто экспериментирует с этим? Является ли это возможным? Есть ли другой вариант реализации полнотекстового поиска на iOS? Я пробовал ...
вопрос задан: 11 December 2011 06:40
0
ответов

Как построить PDFBox для .Net

Я видел примеры извлечения текста из pdf-файлов, которые используют либо ITextSharp, либо PDFBox. PDFBox кажется наиболее "надежным" методом извлечения текста, но он требует много дополнительных шагов. ...
вопрос задан: 10 December 2011 03:17
0
ответов

elasticsearch против solr относительно функций структуры данных / запросов

Я видел много вопросов (и хороших ответов), сравнивающих масштабируемость, скорость и сценарии развертывания для elasticsearch и Solr, но я не могу найти хорошую информацию о каких-либо различиях ...
вопрос задан: 9 December 2011 18:54
0
ответов

Измерение сходства между наборами документов

В целях иллюстрации предположим, что это сервис форума. Мне нужно вычислить «сходство» между сообщениями каждого пользователя, чтобы результат был примерно таким: среди сообщений пользователя A, ...
вопрос задан: 8 December 2011 22:00
0
ответов

Ограничение вывода MoreLikeThis в Solr

Я пытаюсь использовать MoreLikeThis для получения всех похожих документов, но не документов с определенным типом содержимого. Итак, первый запрос должен найти один документ, который я хочу получить "More Like This" из - ...
вопрос задан: 8 December 2011 21:36
0
ответов

Zend Lucene MoreLikeThis

Я использую Zend_Search_Lucene для своей поисковой системы. К сожалению, отсутствует реализация методов MorelikeThis, которые могут найти похожие документы в индексе. Кто-нибудь сталкивался с приличным ...
вопрос задан: 8 December 2011 20:50
0
ответов

Проблема сортировки Solr

Я получаю это странное сообщение об ошибке невозможно выполнить сортировку по многозначному полю: имя поля по всем проиндексированным полям. Это полное сообщение об ошибке от solr

HTTP Status ...

вопрос задан: 6 December 2011 14:12
0
ответов

Solr - выделить фразу запроса

Можно ли выделить все термины запроса? например когда я прошу "Соединенные Штаты", я хочу получить: Соединенные Штаты , а не: Соединенные Штаты Штаты ...
вопрос задан: 29 November 2011 09:55
0
ответов

Выделение совпадающих результатов в полях _all

Я хочу, чтобы совпавшие результаты были выделены. У меня это работает, если я упоминаю имя поля, и оно возвращает выделенный текст, однако, если я указываю поле как «_all», оно не возвращает никакого значения. ...
вопрос задан: 27 November 2011 14:54
0
ответов

IndexNotFoundException, если IndexSearcher вызвал пустой RAMDirectory

# здесь некоторые java_imports index = RAMDirectory.new IndexWriter.new (index, StandardAnalyzer.new (Version :: LUCENE_30), IndexWriter: : MaxFieldLength :: UNLIMITED) IndexSearcher.new (index) генерирует ...
вопрос задан: 27 November 2011 13:45
0
ответов

Sitecore Lucene: переиндексируйте дочерние (или родительские) элементы при обновлении элемента

Ситуация У меня следующая конфигурация Sitecore Lucene: New index, type = "Sitecore.Search.Index, Sitecore.Kernel" {{1} } Содержит два сканера (пользовательский сканер, который добавляет дополнительные "вычисляемые" поля) Каждый ...
вопрос задан: 24 November 2011 09:17