Elasticsearch -EdgeNgram + подсветка + термин _вектор = плохие выделения

Когда я использую анализатор с edgengram (min=3, max=7, front )+ term _vector=with _position _offsets

С документом, имеющим текст = "CouchDB"

Когда я ищу "couc"

Я выделил "cou", а не "couc"


Кажется, мой основной момент касается только минимального соответствующего токена «cou», в то время как я ожидаю, что буду на точном токене (, если это возможно ), или, по крайней мере, на самом длинном найденном токене.

Он отлично работает без анализа текста с помощью term _vector=with _position _offsets

Как повлияет удаление термина _vector=with _position _смещения для производительности?

6
задан Sebastien Lorber 3 July 2012 в 02:19
поделиться