Рекомендации по методам поиска

Это скорее вопрос теории, а не практики. Я работаю над проектом, который представляет собой довольно простой каталог ссылок. Вся модель похожа на каталог Dmoz или Yahoo, за исключением того, что каждая запись имеет определенные дополнительные атрибуты.

У меня есть иерархическая таксономия , работающая со всеми записями с отношением «многие ко многим», все записи теперь являются отсортированы по этим категориям, и вроде все работает нормально. Итак, какой толк в каталоге, если нет опции поиска?

Вот еще немного подробностей о моих моделях: у каждой записи есть заголовок, описание, URL-адрес и несколько профилей в социальных сетях: YouTube, Twitter, Flickr и еще несколько . К каждой записи может быть прикреплен логотип и скрытое поле для тегов. Также, название и описание хранятся на трех разных языках. Итак, в основном я бы хотел, чтобы результаты поиска были:

  1. Соответствующие (включая таксономию)
  2. Возможно, с логотипами
  3. Возможно, со 100% заполненными профилями

Я пробовал Sphinx и в настоящее время работаю с Lucene, но похоже, что я не понимаю поиск в теории. Я надеюсь, что имеет смысл, что заполненные записи должны отображаться выше, чем другие, но я не могу точно определить оценки. Я бы не хотел, чтобы нерелевантные записи появлялись вверху, если во всем описании есть просто совпадение одного слова, поскольку заголовки более релевантны.

Итак, мой вопрос - есть ли какие-нибудь книги, методы или даже другие поисковые машины (если Sphinx и Lucene недостаточно хороши) , которые вы порекомендовали бы в этом отношении ? Я хотел бы не только получить полный контроль над результатами поиска и их рейтингом, но также предоставить моим посетителям правильную и актуальную информацию.

Ссылки на интересные статьи тоже приветствуются!

И Нет , я Я не пытаюсь перестроить Google :)

Спасибо :)

7
задан kovshenin 29 October 2010 в 08:53
поделиться