У меня есть проблема с чередованием пунктуации от индекса solr, Когда знак пунктуации следует прямо после слова затем это слово не индексируется правильно.
Например: если мы индексируем "привет, John", актив не будет найден ключевым словом "привет", в то время как не будет никакой проблемы, если мы удалим запятую после слова "привет".
Есть ли какой-либо FilterFactory, которые предполагают для разделения пунктуации? Какие-либо идеи?
Спасибо, Bogdan.
Это делается с помощью WordDelimiterFilterFactory. Установите generateWordParts = 1.
Также можно использовать PatternTokenizerFactory , но я никогда не пробовал его.