Я в настоящее время настраиваю свой файл schema.xml и пытаюсь выяснить то, что является лучшим способом настроить мои документы. Я использую RMDBS, и таким образом много объектов являются реляционными.
Возьмите этот сайт, например; документ обычно состоит из вопроса, сопровождаемого 0 или больше ответами. Скажите, что Вы хотели бы создать поля для этого, необходимо будет объявить весь вопрос и поля ответа в том же документе, способ, которым я вижу его. Но учитывая тот факт, что может быть больше чем один ответ, необходимо было бы создать документ для каждого ответа. Таким образом, это означает каждый вопрос, и каждый ответ хранится в отдельном документе, который содержит поля для обоих.
Я не вижу другой подход для этого вида проблемы, однако я относительно плохо знаком с Solr и документом DB, таким образом, я могу быть неправым.
Короче говоря: каковы лучшие практики, если я реализовал бы такую схему?
Другой способ сделать это - иметь поле для вопросов и многозначное поле для ответов и располагать их в одном документе. Это, вероятно, лучший способ начать, если только у вас нет специфических требований, которые благоприятствуют подходу "документ-ответ".
Например, если вам нужно сопоставить отдельные ответы как самостоятельные результаты поиска, вы можете получить лучшие результаты и производительность при использовании подхода "документ-ответ", поскольку документы "ответ" будут оцениваться, ранжироваться и загружаться по отдельности.
Но это было бы нетрадиционным использованием такого типа данных. Обычно при поиске на таких сайтах, как stack overflow, вы ищете вопрос и набор ответов, охватывающих определенную тему, поэтому иметь все в одном документе более логично.