Существует ли известная математическая формула, которую я могу использовать для оценки размера нового индекса Lucene? Я знаю, сколько полей я хочу индексировать, и размер каждого поля. И, я знаю, сколькими будут объекты...
Предположите, что у меня есть поле, названное ценой за документы в Solr, и мне фасетировали то поле. Я хочу получить фасеты как диапазоны значений (например: 0-100, 100-500, 500-1000, и т.д.). Как сделать это? Я могу...
Я думаю, что все еще не понимаю lucene индексация опций. Следующие опции являются Хранилищем. Да Хранилище. Нет и Индекс. Маркируемый Индекс. Индекс Un_Tokenized. Никакой Индекс. No_Norms я не делаю действительно...
Я понимаю основную концепцию поиска Lucene / Elastisearch, которая заключается в обратном индексировании, построенном из слов, проанализированных из текстов в документах. Попытка выяснить, хорош ли Lucene / ElasticSearch ...
Я новичок в solr7.5.0, и я не знаю каждый его модуль. Поскольку я строю систему ответов на вопросы, я хочу интегрировать Wordnet, чтобы получить более качественные ответы на запросы. Я гуглил это и нашел ...
Я использую Solr 7,6. Я делаю полный импорт из mysql, таблица customer выглядит так: customer_id pk int customer_code varchar name varchar update_datetime timestamp Я изменяю одну ...
В старой версии Lucene запрос на создание диапазона дат был простым: query = NumericRangeQuery.newLongRange (name, startDate (null, если нет), endDate (null, если нет), includeStart, includeEnd); Я перешел на ...
С TermQuery и PhraseQuery вызывается мой SerbianAnalyzer, но не с FuzzyQuery. Я пытался использовать lucene 4 и lucene 7 с одинаковым поведением. У меня есть следующий код: Query query; Строковое поле = ...
Алгоритм Частотности слова требований для обработки естественного языка Используя Solr, В то время как ответ для того вопроса превосходен, я задавался вопросом, мог ли я использовать все время, я потратил получение...
С перемещением NoSQL, растущим на основе основанных на документе баз данных, я посмотрел на MongoDB в последнее время. Я заметил поразительное сходство с тем, как рассматривать объекты как "Документы", точно так же, как Lucene делает (...
Этим вопросом является ответвление от этого вопроса. Мой запрос является двукратным, но потому что оба связаны, я думаю, что это - хорошая идея соединить их. Как программно создать запросы. Я знаю меня...
Я настроил Apache Nutch 2.3.1 с экосистемой Hadoop / Hbase. В настоящее время для платформы индексирования Apache Solr 6.6.2 используется. Мы проползли около 3 миллионов документов с помощью Nutch и индекса ...
Когда я должен использовать RAMDirectory Lucene? Каковы его преимущества перед другими механизмами хранения? Наконец, где я могу найти простой пример кода?
В соответствии с примером на этой странице документации ElasticSearch следующий шаблон соответствует значениям, заключенным в двойные кавычки: «((?: \\" | [^ "] | \\") *) «Тем не менее, я не пользуюсь второй \\ ", ...
Я хочу к использованию solr для поиска на статьях, у меня есть 3 таблицы: Группа (идентификатор, название группы) ArticleBase (идентификатор, groupId, некоторое другое поле) Статья (идентификатор, articleBaseId, заголовок, дата...) в solr schema.xml...
Я реализую поисковую систему с solr, которые импортируют минимальные 2 миллиона документов в день. Пользователь должен, может искать на импортированном документе как можно скорее (псевдореальное время). Я использующий 2 выделенных Windows x64 с котом 6 (Ч
Я ищу в индексе lucene и строю поисковые запросы типа field1: "hello" AND field2: "world", но я хотел бы искать значение в любом поле, а также значения в определенных полях в ...
Я использую Lucene для показа результатов поиска в веб-приложении. Я - также пользовательская подкачка страниц для показа того же. Результаты поиска могли варьироваться от 5 000 до 10 000 или больше. Может кто-то говорить мне лучшее...
Который lucene анализатор может использоваться для обработки японского текста правильно? Это должно смочь обработать Кандзи, Hiragana, Katakana, Romaji и любую их комбинацию.
Я пытаюсь сравнить производительность различных запросов Solr. Чтобы получить честный тест, я хочу очищать кеш между запросами. Как это делается? Конечно, можно перезапустить сервер, я был ...
Я - разработка предложить поле для моего поискового сервиса сайта. Я имею к полям поиска как они: Visual Basic Enterprise Edition Visual J++ Visual C++ Мой код: dir Каталога = Lucene. Сеть. Хранилище....
Каковы опции когда дело доходит до полнотекстового поиска SaaS/размещать? Как я должен оценить доступные различные варианты? Я ищу что-то, что использует Lucene, solr, или сфинкса на бэкенде...
Мог любой давать мне пример о том, как сделать нечеткое соответствие двух строк с помощью Lucene.NET (или с помощью версии Java Lucene, или на любом другом языке, который имеет порт Lucene).
я создал индекс в Lucene. Я хочу, не указывая запрос, только для получения счета (подобие косинуса или другое расстояние?) между двумя документами в индексе. Например, я добираюсь от...
У меня есть recenlty, споткнувшийся в порт Zend Lucene проекта Lucene. У меня есть немного опыта с SOLR, таким образом, я хотел бы знать то, что является различием между двумя из них особенно от...
Я использую стеммер Портера для стемминга слов и здесь являюсь проблемой, с которой я сталкиваюсь: Word "ипотека" правильно останавливается к "mortgag" Word "залогодержатель", (возможно неправильно), произошел для "закла
Мне нужно нормализовать Lucene получает баллы от 0 до 1. Например, случайный запрос возвращает следующие баллы ... 8,864665
2,792687
2,792687
2,792687
2,792687
0,49009037
0,33730242 0,33730242 0 ....
Запрос Lucene и фильтр? Они оба делают похожие вещи, например, фильтры запросов по значению термина, фильтр, я думаю, существует для той же цели. Когда вы бы использовали фильтр и когда запросили? Только начинаю ...
Надеялся получать мысли народов о совершенствовании индекса Lucene, поскольку изменения внесены в объекты модели предметной области приложения. Рассматриваемое приложение является базирующимся веб-приложением Java/J2EE...
Solr новичок здесь. Я создал индекс Solr и записал в него целую кучу документов. На странице администрирования Solr я вижу, что документы существуют и схема тоже подойдет. Я создал индекс Solr и записал в него целую кучу документов. На странице администр