Я 2-й VisualAssist, использование его начиная с V6, не могу жить без него...
я вижу, что ни у кого нет mentiond CoolCommands: http://geekswithblogs.net/brians/archive/2007/03/04/107922.aspx
Большой набор средств экономии времени...
Есть много простых и не такие простые примеры алгоритмов предложения в отличном Программирование коллективного разума
Коэффициент корреляции Пирсона (небольшая сухая статья в Википедии) может дать довольно хорошие результаты. Вот реализация в Python и другая в TSQL вместе с интересным объяснением алгоритма.
попробуйте алгоритм Slope One , это один из наиболее часто используемых для такого рода задач.
вот пример реализации в t-sql
Я бы пошел с K ближайшими соседями. В статье википедии это хорошо объясняется и есть ссылки на эталонные реализации.
Вы можете посмотреть Изучение правил ассоциации и Априорный алгоритм . Основная идея заключается в том, что вы создаете такие правила, как «если пользователю нравится Object1, то пользователю нравится Object2» и проверяете, насколько хорошо они описывают (вашу) реальность. В вашем конкретном примере это правило будет иметь поддержку 2 (как два пользователя, например Object1) и достоверность 50% a (поскольку правило верно в 1 из 2 случаев). Я только что сам реализовал базовую проверку концепции (на самом деле мои первые шаги в Hadoop), и это не так уж сложно сделать.
В качестве альтернативы, вы можете посмотреть Apache Mahout - Taste . Но сам я им никогда не пользовался.
Я создал алгоритм предлагаемых статей, который использовал ключевые слова (как в отличие от «покупки продукта») для определения корреляции. Он берет ключевое слово, проходит через все другие статьи, где встречается это ключевое слово, и дает результаты на основе того, какие статьи имеют наиболее подходящие ключевые слова.
Помимо очевидной потребности в кэшировании такой информации, что-то не так с ним, используя аналогичный метод?