Алгоритмам для нахождения материала, который пользователь хотел бы на основе других пользователей, нравится

~ / .vimrc

cmap sh<CR> !bash --login<CR>

Если вы быстро введете «sh < Enter>» в командной строке, вы можете запустить bash с помощью источника ~ / .bashrc. Так грязно.

8
задан Amro 31 July 2010 в 23:12
поделиться

5 ответов

There are a few algorithms that are good for this:

ARTMAP: groups via probability against each other (this isn't fast but its the best thing for your problem IMO)

ARTMAP holds a group of common attributes and determines likelyhood of simliarity via a percentages. ARTMAP

KMeans: This seperates out the vectors by the distance that they are from each other KMeans: Wikipedia

PCA: will seperate the average of all the values from the varing bits. This is what you would use to do face detection, and background subtraction in Computer Vision. PCA

2
ответ дан 5 December 2019 в 12:59
поделиться

The K-nearest neighbor algorithm may be right up your alley.

2
ответ дан 5 December 2019 в 12:59
поделиться

Это похоже на этот вопрос , где ОП хотел построить систему рекомендаций. Вкратце, нам предоставляется набор обучающих данных, состоящий из оценок пользователей фильмов (например, оценка от 1 до 5 звезд) и набора атрибутов для каждого фильма (год, жанр, актеры и т. Д.). Мы хотим создать рекомендатель, чтобы он выводил для невидимых фильмов возможную оценку. Таким образом, данные inpt выглядят так:

user movie   year   genre   ...    | rating
---------------------------------------------
  1    1     2006   action         |    5
  3    2     2008   drama          |    3.5
  ...

, а для фильма без рейтинга X:

10    20     2009   drama   ?

мы хотим спрогнозировать рейтинг. Выполнение этого для всех невидимых фильмов с последующей сортировкой по прогнозируемому рейтингу фильмов и выводом 10 лучших дает вам систему рекомендаций.

Самый простой подход - использовать алгоритм k-ближайшего соседа . Этот подход имеет то преимущество, что его очень просто реализовать с нуля.

Существуют и другие, более сложные подходы. Например, вы можете построить дерево решений , подогнать набор правил к обучающим данным. Вы также можете использовать байесовские сети , искусственные нейронные сети , , поддерживающие векторные машины , среди многих других ... правильный фон. Тем не менее, я ожидаю, что вы будете использовать внешний инструмент / библиотеку. Теперь вы, кажется, знакомы с байесовскими сетями, поэтому простая наивная байесовская сеть на самом деле может быть очень мощной. Одно из преимуществ состоит в том, что он позволяет делать прогнозы при отсутствии данных.

Основная идея в чем-то такая же; возьмите входные данные, которые у вас есть, обучите модель, а затем используйте ее для прогнозирования класса новых экземпляров.

Если вы хотите поиграть с разными алгоритмами в простом интуитивно понятном пакете, который не требует программирования, я предлагаю вам взглянуть на Weka (мой 1-й выбор), Orange или RapidMiner . Самым сложным было бы подготовить набор данных к требуемому формату. Остальное так же просто, как выбрать алгоритм и применить его (всего за несколько кликов!)

Думаю, для тех, кто не хочет вдаваться в подробности,

4
ответ дан 5 December 2019 в 12:59
поделиться

Ознакомьтесь с некоторыми работами лучших команд для приз netflix .

1
ответ дан 5 December 2019 в 12:59
поделиться
Другие вопросы по тегам:

Похожие вопросы: