Как сопоставить с подмножествами строки поиска в SOLR / lucene

У меня необычная ситуация. Обычно при поиске по текстовому индексу вы ищете небольшое количество ключевых слов по сравнению с документами с большим количеством терминов.

Например, вы можете искать «быстро коричневый» и ожидать совпадения «быстрый коричневый лис перепрыгивает через ленивая собака ».

У меня есть ситуация, когда в моем хранилище документов хранится много маленьких фраз, и я хочу сопоставить их с более крупной фразой запроса.

Например, если у меня есть запрос:

  • « the быстрая коричневая лиса перепрыгивает через ленивого пса "

и документы

  • "quick brown"
  • "fox over"
  • "lazy dog"

Я хотел бы найти документы, в которых есть фраза, встречающаяся в запросе. В этом случае «быстрый коричневый» и «ленивый пес» (но не «лисица», потому что, хотя токены совпадают, это не фраза в строке поиска).

Возможен ли такой запрос с SOLR / lucene?

5
задан Glen 3 February 2011 в 03:44
поделиться