2
ответа

Как я оцениваю размер индекса Lucene?

Существует ли известная математическая формула, которую я могу использовать для оценки размера нового индекса Lucene? Я знаю, сколько полей я хочу индексировать, и размер каждого поля. И, я знаю, сколькими будут объекты...
вопрос задан: 15 September 2008 18:24
2
ответа

Как получить фасетные диапазоны в результатах solr?

Предположите, что у меня есть поле, названное ценой за документы в Solr, и мне фасетировали то поле. Я хочу получить фасеты как диапазоны значений (например: 0-100, 100-500, 500-1000, и т.д.). Как сделать это? Я могу...
вопрос задан: 29 August 2008 05:09
1
ответ

Индексация Lucene: Хранилище и режимы индексации объяснены

Я думаю, что все еще не понимаю lucene индексация опций. Следующие опции являются Хранилищем. Да Хранилище. Нет и Индекс. Маркируемый Индекс. Индекс Un_Tokenized. Никакой Индекс. No_Norms я не делаю действительно...
вопрос задан: 5 September 2019 09:11
1
ответ

Elasticsearch хорош для документов с несколькими словами

Я понимаю основную концепцию поиска Lucene / Elastisearch, которая заключается в обратном индексировании, построенном из слов, проанализированных из текстов в документах. Попытка выяснить, хорош ли Lucene / ElasticSearch ...
вопрос задан: 10 March 2019 18:05
1
ответ

интегрировать WordNet с Solr7.5.0

Я новичок в solr7.5.0, и я не знаю каждый его модуль. Поскольку я строю систему ответов на вопросы, я хочу интегрировать Wordnet, чтобы получить более качественные ответы на запросы. Я гуглил это и нашел ...
вопрос задан: 4 March 2019 09:47
1
ответ

Apache Solr по-прежнему сохраняет старые данные после дельта-импорта

Я использую Solr 7,6. Я делаю полный импорт из mysql, таблица customer выглядит так: customer_id pk int customer_code varchar name varchar update_datetime timestamp Я изменяю одну ...
вопрос задан: 17 January 2019 09:57
1
ответ

Запрос диапазона дат с Lucene 7

В старой версии Lucene запрос на создание диапазона дат был простым: query = NumericRangeQuery.newLongRange (name, startDate (null, если нет), endDate (null, если нет), includeStart, includeEnd); Я перешел на ...
вопрос задан: 17 January 2019 09:38
1
ответ

Apache Lucene QueryParser.parse не использует Analyzer в FuzzyQuery

С TermQuery и PhraseQuery вызывается мой SerbianAnalyzer, но не с FuzzyQuery. Я пытался использовать lucene 4 и lucene 7 с одинаковым поведением. У меня есть следующий код: Query query; Строковое поле = ...
вопрос задан: 16 January 2019 22:26
1
ответ

SOLR и синтаксический анализ естественных языков - я могу использовать его?

Алгоритм Частотности слова требований для обработки естественного языка Используя Solr, В то время как ответ для того вопроса превосходен, я задавался вопросом, мог ли я использовать все время, я потратил получение...
вопрос задан: 21 October 2017 09:18
1
ответ

NoSQL (MongoDB) по сравнению с Lucene (или Solr) как Ваша база данных

С перемещением NoSQL, растущим на основе основанных на документе баз данных, я посмотрел на MongoDB в последнее время. Я заметил поразительное сходство с тем, как рассматривать объекты как "Документы", точно так же, как Lucene делает (...
вопрос задан: 22 September 2017 08:01
1
ответ

Как создать более сложные строки запроса Lucene?

Этим вопросом является ответвление от этого вопроса. Мой запрос является двукратным, но потому что оба связаны, я думаю, что это - хорошая идея соединить их. Как программно создать запросы. Я знаю меня...
вопрос задан: 23 May 2017 10:32
1
ответ

обработка псевдонимов доменов в Apache Nutch 2.3.1 [дубликат]

Я настроил Apache Nutch 2.3.1 с экосистемой Hadoop / Hbase. В настоящее время для платформы индексирования Apache Solr 6.6.2 используется. Мы проползли около 3 миллионов документов с помощью Nutch и индекса ...
вопрос задан: 19 April 2016 15:11
1
ответ

Использование RAMDirectory

Когда я должен использовать RAMDirectory Lucene? Каковы его преимущества перед другими механизмами хранения? Наконец, где я могу найти простой пример кода?
вопрос задан: 26 June 2015 12:31
1
ответ

Соответствующие двойные кавычки с регулярными выражениями [duplicate]

В соответствии с примером на этой странице документации ElasticSearch следующий шаблон соответствует значениям, заключенным в двойные кавычки: «((?: \\" | [^ "] | \\") *) «Тем не менее, я не пользуюсь второй \\ ", ...
вопрос задан: 8 April 2014 21:11
1
ответ

Обновите определенное поле на индексе SOLR

Я хочу к использованию solr для поиска на статьях, у меня есть 3 таблицы: Группа (идентификатор, название группы) ArticleBase (идентификатор, groupId, некоторое другое поле) Статья (идентификатор, articleBaseId, заголовок, дата...) в solr schema.xml...
вопрос задан: 31 March 2014 09:10
1
ответ

Инкрементное резервное копирование Solr в системе реального времени с тяжелым индексом

Я реализую поисковую систему с solr, которые импортируют минимальные 2 миллиона документов в день. Пользователь должен, может искать на импортированном документе как можно скорее (псевдореальное время). Я использующий 2 выделенных Windows x64 с котом 6 (Ч
вопрос задан: 22 February 2014 03:51
1
ответ

Как искать по нескольким полям в Lucene, используя синтаксис запроса?

Я ищу в индексе lucene и строю поисковые запросы типа field1: "hello" AND field2: "world", но я хотел бы искать значение в любом поле, а также значения в определенных полях в ...
вопрос задан: 3 March 2013 18:40
1
ответ

Результаты поиска Lucene подкачки страниц

Я использую Lucene для показа результатов поиска в веб-приложении. Я - также пользовательская подкачка страниц для показа того же. Результаты поиска могли варьироваться от 5 000 до 10 000 или больше. Может кто-то говорить мне лучшее...
вопрос задан: 19 July 2012 03:55
1
ответ

Что lucene анализатор может использоваться для обработки японского текста?

Который lucene анализатор может использоваться для обработки японского текста правильно? Это должно смочь обработать Кандзи, Hiragana, Katakana, Romaji и любую их комбинацию.
вопрос задан: 29 April 2012 17:59
1
ответ

Как очистить кеш в Solr ?

Я пытаюсь сравнить производительность различных запросов Solr. Чтобы получить честный тест, я хочу очищать кеш между запросами. Как это делается? Конечно, можно перезапустить сервер, я был ...
вопрос задан: 1 February 2012 14:32
1
ответ

Lucene. Сетевой PrefixQuery

Я - разработка предложить поле для моего поискового сервиса сайта. Я имею к полям поиска как они: Visual Basic Enterprise Edition Visual J++ Visual C++ Мой код: dir Каталога = Lucene. Сеть. Хранилище....
вопрос задан: 26 November 2011 22:58
1
ответ

Как оценить размещенные решения для полнотекстового поиска?

Каковы опции когда дело доходит до полнотекстового поиска SaaS/размещать? Как я должен оценить доступные различные варианты? Я ищу что-то, что использует Lucene, solr, или сфинкса на бэкенде...
вопрос задан: 18 November 2011 16:30
1
ответ

Lucene.NET (представляет нечеткое соответствие в виде строки),

Мог любой давать мне пример о том, как сделать нечеткое соответствие двух строк с помощью Lucene.NET (или с помощью версии Java Lucene, или на любом другом языке, который имеет порт Lucene).
вопрос задан: 25 September 2011 01:39
1
ответ

получите подобие косинуса между двумя документами в lucene

я создал индекс в Lucene. Я хочу, не указывая запрос, только для получения счета (подобие косинуса или другое расстояние?) между двумя документами в индексе. Например, я добираюсь от...
вопрос задан: 14 July 2011 22:32
1
ответ

Zend_Search_Lucene по сравнению с SOLR

У меня есть recenlty, споткнувшийся в порт Zend Lucene проекта Lucene. У меня есть немного опыта с SOLR, таким образом, я хотел бы знать то, что является различием между двумя из них особенно от...
вопрос задан: 30 March 2011 17:16
1
ответ

пехлеви lucene проблема со словом “ипотека”

Я использую стеммер Портера для стемминга слов и здесь являюсь проблемой, с которой я сталкиваюсь: Word "ипотека" правильно останавливается к "mortgag" Word "залогодержатель", (возможно неправильно), произошел для "закла
вопрос задан: 30 March 2011 06:24
1
ответ

Как нормализовать оценки Lucene?

Мне нужно нормализовать Lucene получает баллы от 0 до 1. Например, случайный запрос возвращает следующие баллы ... 8,864665 2,792687 2,792687 2,792687 2,792687 0,49009037 0,33730242 0,33730242 0 ....
вопрос задан: 21 March 2011 14:38
1
ответ

Lucene: В чем разница между запросом и фильтром

Запрос Lucene и фильтр? Они оба делают похожие вещи, например, фильтры запросов по значению термина, фильтр, я думаю, существует для той же цели. Когда вы бы использовали фильтр и когда запросили? Только начинаю ...
вопрос задан: 15 September 2010 19:18
1
ответ

Стратегии того, чтобы усовершенствовать Индекс Lucene изменений модели предметной области

Надеялся получать мысли народов о совершенствовании индекса Lucene, поскольку изменения внесены в объекты модели предметной области приложения. Рассматриваемое приложение является базирующимся веб-приложением Java/J2EE...
вопрос задан: 10 September 2010 20:55
1
ответ

Индекс Solr, по-видимому, действителен - но не дает результатов

Solr новичок здесь. Я создал индекс Solr и записал в него целую кучу документов. На странице администрирования Solr я вижу, что документы существуют и схема тоже подойдет. Я создал индекс Solr и записал в него целую кучу документов. На странице администр
вопрос задан: 16 August 2010 13:26