Lucene Highlighter с анализатором основы

Я использую класс Lucene Highlighter для выделения фрагментов совпадающих результатов поиска, и он работает хорошо. Я хотел бы перейти от поиска с помощью StandardAnalyzer к EnglishAnalyzer, который будет выполнять определение терминов.

Результаты поиска хорошие, но теперь подсветчик не всегда находит совпадения. Вот пример того, что я ищу:

document field text 1: Everyone likes goats.

document field text 2: I have a goat that eats everything.

С помощью EnglishAnalyzer и поиска «коза» оба документа совпадают, но маркер может найти только совпадающий фрагмент из документа 2. Есть ли способ получить маркер возвращает данные для обоих документов?

Я понимаю, что символы для токенов разные, но те же самые жетоны все еще там, поэтому кажется разумным просто выделить любой токен, присутствующий в этом месте.

Если это поможет, это использование Lucene 3.5.

5
задан user605331 26 April 2012 в 19:10
поделиться