Я использую анализатор снежного кома для определения заголовков нескольких документов. Все работает хорошо, но есть свои особенности. Пример: поиск по запросу «клапан», «клапан» или «клапаны» возвращает одно и то же число ...
Я работаю с Solr и хотел бы знать, возможно ли использование предложения LIKE в запросе. Например, я хочу знать все организации, в названии которых есть «Нью-Йорк». В SQL это будет ...
Я уже заранее определил усиление. У меня есть поле в индексе solr под названием boost1. Это поле повышения будет иметь значение от 1 до 10, аналогичное рейтингу Google PR. Это усиление, которое ...
Я знаю, что lucene создает индекс и хранит все данные. Может ли кто-нибудь сказать мне, как данные хранятся в плоском файле? Или какие алгоритмы они используют для хранения данных в бэкенде, чтобы они могли ...
У меня есть специфическое приложение, которое требует, чтобы количество файлов, составляющих индекс, было как можно меньше. Раньше, когда я использовал Lucene.NET 2.9.2, я мог держать весь индекс в 3 (или 4) ...
например, если я ищу в указателе названий книг с термином «harry» , «Грязный Гарри» оценивается одинаково, как «Гарри Поттер», а когда два предмета имеют одинаковую оценку, порядок выбирается случайным образом. Я бы хотел ...
Я пытаюсь сделать каталог телефонов/местных предприятий с возможностью поиска, используя Apache Lucene. У меня есть поля для названия улицы, названия предприятия, номера телефона и т.д. Проблема заключается в том, что когда я пытаюсь ...
Может ли кто-нибудь провести простой сравнительный анализ этих поисковых систем? Какие преимущества у обоих фреймворков? Кстати, я видел следующие основные объяснения выбора mg4j из нескольких ...
У меня есть индекс из большого корпуса с несколькими полями. Только одно из этих полей содержит текст.
Мне нужно извлечь уникальные слова из всего индекса на основе этого поля.
Кто-нибудь знает, как я могу сделать ...
Я хотел бы использовать Lucene для обеспечения возможности полнотекстового поиска по некоторым из моих java-объектов, хранящихся с EclipseLink в моей базе данных Postgresql. Я видел, что Hibernate имеет интегрированное решение для Lucene ...
Я использую lucene для индексирования документов и выполнения поиска, после которого я немедленно удаляю их. все это можно рассматривать как несколько атомарное действие, включающее следующие шаги: index (...
Я использую Version.Lucene_29. Используя обычный метод строкового запроса, я мог сделать следующее: Directory directory = new FSDirectory (...);
// Запускаем получение Lucene.
IndexSearcher iSearch = new ...
Приложение My Grails использует подключаемый модуль с возможностью поиска, который основан на Compass и Lucene для обеспечения функциональности поиска. У меня есть два класса с возможностью поиска, например, «Автор» и «Книга». Я сопоставил эти классы с .
JVM постоянно дает сбой. Я не могу понять, в чем проблема. Я тестировал последнюю версию 1.6 jdk, а также 1.7. Та же проблема. Я выполнил проверку памяти, и ошибок не было. Я ...
Какие анализаторы следует использовать для индексации и поиска, когда я хочу, чтобы точное совпадение оценивалось выше, чем "частичное " соответствие? Возможно, настроить индивидуальную оценку в классе подобия? Например, когда ...
Я использую базу данных MySQL для своего webapp.
Мне нужен поиск по нескольким таблицам и нескольким столбцам, это очень похоже на полнотекстовый поиск в этих столбцах. Мне нужно знать ваш опыт в ...
Предположим, у нас есть набор mp3-плееров с именами и ценами. Как написать правильный поисковый запрос для поиска всех товаров с определенным названием и ценой менее 100 $? q = "(name: (ipod) AND ...
Меня интересует запрос к Solr с запросом q и отображение его отзыва для набора документов D, когда возвращаются документы {10, 20, 30, ...}. В настоящее время у меня есть полные результаты, то есть список ...
Я обнаружил в папке contrib lucene 3.5 два плагина: один группирует, другой фасет.
В моем варианте оба они использовались для разделения моих документов на разные категории. Почему у lucene теперь два ...
Я хочу скомпилировать и использовать Xapian с xcode на iOS, есть ли кто-нибудь, кто экспериментирует с этим? Является ли это возможным? Есть ли другой вариант реализации полнотекстового поиска на iOS? Я пробовал
...
Я видел примеры извлечения текста из pdf-файлов, которые используют либо ITextSharp, либо PDFBox. PDFBox кажется наиболее "надежным" методом извлечения текста, но он требует много дополнительных шагов. ...
Я видел много вопросов (и хороших ответов), сравнивающих масштабируемость, скорость и сценарии развертывания для elasticsearch и Solr, но я не могу найти хорошую информацию о каких-либо различиях ...
В целях иллюстрации предположим, что это сервис форума. Мне нужно вычислить «сходство» между сообщениями каждого пользователя, чтобы результат был примерно таким: среди сообщений пользователя A, ...
Я пытаюсь использовать MoreLikeThis для получения всех похожих документов, но не документов с определенным типом содержимого. Итак, первый запрос должен найти один документ, который я хочу получить "More Like This" из - ...
Я использую Zend_Search_Lucene для своей поисковой системы. К сожалению, отсутствует реализация методов MorelikeThis, которые могут найти похожие документы в индексе. Кто-нибудь сталкивался с приличным ...
Я получаю это странное сообщение об ошибке невозможно выполнить сортировку по многозначному полю: имя поля по всем проиндексированным полям. Это полное сообщение об ошибке от solr
Можно ли выделить все термины запроса? например когда я прошу "Соединенные Штаты", я хочу получить: Соединенные Штаты , а не: Соединенные Штаты Штаты
...
Я хочу, чтобы совпавшие результаты были выделены. У меня это работает, если я упоминаю имя поля, и оно возвращает выделенный текст, однако, если я указываю поле как «_all», оно не возвращает никакого значения.
...
Ситуация У меня следующая конфигурация Sitecore Lucene: New index, type = "Sitecore.Search.Index, Sitecore.Kernel" {{1} } Содержит два сканера (пользовательский сканер, который добавляет дополнительные "вычисляемые" поля)
Каждый ...