Поиск дефисных слов с помощью Lucene

Я хочу, чтобы lucene искала дефисные слова, например: энергосберегающий или «энергосберегающий» как одно слово

Так, если вход является энергоэффективным, токенизатор генерирует такие термины, как энергия или эффективная или энергоэффективная или энергоэффективная

Поэтому люцен возвращается со страницами, содержащими как «энергоэффективные», так и «энергоэффективные», но я хочу, чтобы он возвращался исключительно со страницами для энергоэффективных

. Итак, вопрос Как я могу изменить стандартный токенизатор для поиска энергоэффективного как одного целого слова, а не разбивать его на отдельные слова.

6
задан Madhura 31 August 2010 в 20:03
поделиться