5
ответов

Понимание теоремы Байеса

Я работаю над реализацией наивного классификатора Байеса. Программирование Коллективного разума представляет этот предмет путем описания теоремы Байеса как: PR (| B) = PR (B | A) x PR (A) / PR (B) Также...
вопрос задан: 10 April 2019 21:07
5
ответов

Что попробовало, и истинные алгоритмы для предложения похожих статей там?

Довольно общая ситуация, я держал бы пари. У Вас есть блог-сайт или новостной сайт, и у Вас есть много статей или билетов, полученных бесплатно или независимо от того, что Вы называете их, и Вы хотите, у основания каждого, предложить других, которые кажут
вопрос задан: 6 December 2009 04:46
4
ответа

Алгоритм классификации / категоризации текста [закрыт]

Моя цель - [полу] автоматически присваивать тексты различным категориям. Существует набор пользовательских категорий и набор текстов для каждой категории. Идеальный алгоритм должен уметь учиться ...
вопрос задан: 27 August 2010 13:12
0
ответов

Понимание теоремы Байеса

Я работаю над реализацией наивного классификатора Байеса. Программирование Коллективного разума представляет этот предмет путем описания теоремы Байеса как: PR (| B) = PR (B | A) x PR (A) / PR (B) Также...
вопрос задан: 10 April 2019 21:07
0
ответов

Наборы данных новостной статьи [закрыто]

Я занимаюсь проектом по классификации новостей. В основном система будет классифицировать новостные статьи на основе заранее определенной темы (например, спортивная, политическая, международная). Чтобы построить систему, мне нужно бесплатно ...
вопрос задан: 23 May 2017 12:18
0
ответов

Вычисление IDF (Обратная частота документа )для категоризации документа

У меня есть сомнения в вычислении IDF (Обратной частоты документа )при категоризации документов. У меня более одной категории с несколькими документами для обучения. Я вычисляю IDF для каждого члена в...
вопрос задан: 29 August 2012 07:27
0
ответов

Какой алгоритм классификации можно использовать для категоризации документов?

Эй, вот моя проблема. Учитывая набор документов, мне нужно отнести каждый документ к предопределенной категории. Я собирался использовать подход n -грамм для представления текстового -содержания каждого документа и...
вопрос задан: 20 August 2012 01:54
0
ответов

Словарные слова для загрузки

Может кто-нибудь подсказать, где найти словарный список с частотной информацией? В идеале источником должны быть английские слова североамериканского разнообразия.
вопрос задан: 19 June 2012 13:43
0
ответов

Базовая классификация текста с помощью Weka в Java

Я пытаюсь создать классификатор текста в JAVA с помощью Weka. Я прочитал несколько руководств и пытаюсь создать свой собственный классификатор. У меня есть следующие категории: компьютер, спорт, неизвестность и ...
вопрос задан: 14 March 2012 22:25
0
ответов

Классификация SQL

У меня есть система, которая отслеживает, какие документы просматривают пользователи. У каждого документа есть свой идентификатор и кластер, к которому он принадлежит. Моя система отслеживает идентификатор сеанса и количество просмотров. Теперь я хотел б
вопрос задан: 17 February 2012 06:49
0
ответов

Группирование предложений по настроению

Начнем с простой задачи. Предположим, у меня есть предложение из 350 символов, и я хотел бы отнести его к категории "Хорошее настроение" или "Плохое настроение". Как лучше всего ...
вопрос задан: 9 September 2011 01:24
0
ответов

Выбор функции тега части речи (POS) для классификации текста

У меня есть предложения тега POS, полученные с помощью Стэнфордского тега POS. Например: / DT island / NN был / VBD very / RB beautiful / JJ ./. Я / PRP люблю / VBP it / PRP ./. (также доступен формат xml). Кто-нибудь может объяснить, как ...
вопрос задан: 31 March 2011 11:57
0
ответов

Как включить слова в качестве числового признака в классификацию

Как лучше всего использовать сами слова в качестве признаков в любом алгоритме машинного обучения? Проблема, которую я должен извлечь из определенного абзаца. Следует ли мне использовать ...
вопрос задан: 17 November 2010 17:13