Elasticsearch -EdgeNgram + подсветка + термин _вектор = плохие выделения

Question

Elasticsearch -EdgeNgram + подсветка + термин _вектор = плохие выделения

Когда я использую анализатор с edgengram (min=3, max=7, front )+ term _vector=with _position _offsets

С документом, имеющим текст = "CouchDB"

Когда я ищу "couc"

Я выделил "cou", а не "couc"

Кажется, мой основной момент касается только минимального соответствующего токена «cou», в то время как я ожидаю, что буду на точном токене (, если это возможно ), или, по крайней мере, на самом длинном найденном токене.

Он отлично работает без анализа текста с помощью term _vector=with _position _offsets

Как повлияет удаление термина _vector=with _position _смещения для производительности?

6

elasticsearch java search lucene n-gram

задан Sebastien Lorber 3 July 2012 в 02:19

0 ответов

Другие вопросы по тегам:

elasticsearch java search lucene n-gram

Elasticsearch -EdgeNgram + подсветка + термин _вектор = плохие выделения

0 ответов

Похожие вопросы: