Я работаю над реализацией наивного классификатора Байеса. Программирование Коллективного разума представляет этот предмет путем описания теоремы Байеса как:
Pr(A | B) = Pr(B | A) x Pr(A)/Pr(B)
А также определенный пример, относящийся к классификации документов:
Pr(Category | Document) = Pr(Document | Category) x Pr(Category) / Pr(Document)
Я надеялся, что кто-то мог объяснить мне нотацию, используемую здесь, что делает Pr(A | B)
и Pr(A)
средний? Похоже на своего рода функцию, но затем что делает канал ("|
") средний, и т.д.?
Но вышеизложенное относится к вычислению условной вероятности. Вам нужен классификатор, который использует этот принцип, чтобы решить, принадлежит ли что-то к категории на основе предыдущей вероятности.
Смотрите http://en.wikipedia.org/wiki/Naive_Bayes_classifier для полного примера
.Pr(A | B): Условная вероятность А : т.е. вероятность А, учитывая, что все, что мы знаем, это B
Pr(A) : Предварительная вероятность А
.труба (|) означает "дано". Вероятность А, данная В, равна вероятности В, данной А x Pr(A)/Pr(B)
.Исходя из вашего вопроса, я могу настоятельно посоветовать вам сначала прочитать какую-нибудь книгу для бакалавров по теории вероятностей. Без этого вы не продвинетесь должным образом в выполнении задания по Naive Bayes Classifier.
Я бы порекомендовал вам эту книгу http://www.athenasc.com/probbook.html или посмотрите MIT OpenCourseWare.
.