Я рассматриваю / работающий над реализацией поисковой системы для различных типов контента нашей компании и пытаюсь перенести голову вокруг Lucene (конкретно разновидность .NET).
В настоящий момент мой основной вопрос состоит в том, должны ли документы, которые каждый индексирует, содержать те же поля.
Например:
Document1:
Document2:
... и т.д