Как обеспечить наиболее релевантные результаты с помощью многофакторной взвешенной сортировки

Question

Как обеспечить наиболее релевантные результаты с помощью многофакторной взвешенной сортировки

Мне нужно обеспечить взвешенную сортировку по 2+ факторам, упорядоченным по «актуальность». Однако факторы не изолированы полностью, я хочу, чтобы один или несколько факторов влияли на «срочность» (вес) других.

Пример: добавленный контент ( статей ) можно проголосовать за / против и, таким образом, получить рейтинг; у них есть дата публикации, и они также помечены категориями. Пользователи пишут статьи и могут голосовать, а также могут иметь или не иметь какой-то рейтинг (эксперт и т. Д.).Наверное, похоже на StackOverflow, не так ли?

Я хочу предоставить каждому пользователю список статей, сгруппированных по тегам, но отсортированных по «релевантности», где релевантность рассчитывается на основе рейтинга и возраста статьи. , и, возможно, зависит от рейтинга автора. I.E. статья с высоким рейтингом, написанная несколько лет назад, не обязательно может быть такой же актуальной, как статья со средним рейтингом, написанная вчера. И, возможно, если бы статья была написана экспертом, она была бы более актуальной, чем статья, написанная «Джо Шмо».

Другим хорошим примером может быть присвоение гостиницам «мета-оценки», состоящей из цены, рейтинга и достопримечательностей .

У меня вопрос: какой алгоритм для многофакторной сортировки лучше? Это может быть дубликатом этого вопроса , но меня интересует общий алгоритм для любого количества факторов (более разумное ожидание - 2–4 фактора), предпочтительно «полностью автоматическая» функция, которая Мне не нужно настраивать или требовать ввода данных пользователем, и я не могу анализировать линейную алгебру и странность собственных векторов.

Возможности, которые я обнаружил на данный момент:

Примечание: S - это «оценка сортировки»

Варианты №3 или №4 выглядят действительно многообещающими, поскольку вам действительно не нужно выбирать произвольную схему взвешивания, как в вариантах №1 и №2, но проблема в том, как это сделать для более чем двух факторов. ?

Я также наткнулся на реализацию SQL для двухфакторного алгоритма взвешивания , который мне в конечном итоге нужно будет написать.

29

algorithm sorting bayesian relevance weighted-average

задан Community 23 May 2017 в 12:25

1 ответ

Другие вопросы по тегам:

algorithm sorting bayesian relevance weighted-average

Как обеспечить наиболее релевантные результаты с помощью многофакторной взвешенной сортировки

1 ответ

Похожие вопросы: