Я использую класс Lucene Highlighter для выделения фрагментов совпадающих результатов поиска, и он работает хорошо. Я хотел бы перейти от поиска с помощью StandardAnalyzer к EnglishAnalyzer, который будет выполнять определение терминов.
Результаты поиска хорошие, но теперь подсветчик не всегда находит совпадения. Вот пример того, что я ищу:
document field text 1: Everyone likes goats.
document field text 2: I have a goat that eats everything.
С помощью EnglishAnalyzer и поиска «коза» оба документа совпадают, но маркер может найти только совпадающий фрагмент из документа 2. Есть ли способ получить маркер возвращает данные для обоих документов?
Я понимаю, что символы для токенов разные, но те же самые жетоны все еще там, поэтому кажется разумным просто выделить любой токен, присутствующий в этом месте.
Если это поможет, это использование Lucene 3.5.