0
ответов

K Алгоритм ближайшего соседа

Может быть, я довольно тупой, но просто не могу найти удовлетворительного ответа: Используя KNN-алгоритм, скажем, k = 5. Теперь я пытаюсь классифицировать неизвестный объект, получая его 5 ближайших соседей. Что делать, если после ...
вопрос задан: 21 May 2017 14:10
0
ответов

Помогите мне понять линейную разделимость в двоичной SVM

Я отправляю это кросс-публикование с math.stackexchange.com, потому что я не получаю никаких сообщений. обратная связь, и это вопрос срочный для меня. Мой вопрос относится к линейной разделимости с гиперплоскостями в ...
вопрос задан: 13 April 2017 12:19
0
ответов

Scikit и Pandas :Подгонка больших данных

Как мне использовать scikit -для обучения модели на больших данных csv (~75 МБ )без проблем с памятью? Я использую блокнот IPython в качестве среды программирования и пакеты pandas+sklearn для...
вопрос задан: 5 January 2017 00:10
0
ответов

Простое объяснение наивной байесовской классификации

Мне трудно понять процесс наивного Байеса, и мне было интересно, может ли кто-нибудь объяснить это простым пошаговым процессом на английском языке. Я понимаю, что это требует сравнения в разы ...
вопрос задан: 26 December 2016 00:21
0
ответов

Сохранить классификатор на диск в scikit-learn

Как сохранить обученный наивный байесовский классификатор на диск и использовать его для прогнозирования данных? У меня есть следующий пример программы с веб-сайта scikit-learn: из наборов данных импорта sklearn iris = наборы данных....
вопрос задан: 11 April 2016 16:26
0
ответов

классификатор sklearn get ValueError: неправильная форма ввода

У меня есть csv, структура является CAT1, CAT2, TITLE, URL, CONTENT, CAT1, CAT2, TITLE, CONTENT на китайском языке. Я хочу обучить LinearSVC или MultinomialNB с X (TITLE) и функцией (CAT1, CAT2), оба получают эту ошибку. ...
вопрос задан: 3 August 2015 04:57
0
ответов

Действительно ли метод rfcv R randomForest говорит, какие функции он выбрал, или нет?

Я хотел бы использовать rfcv для отбраковки неважных переменных из набора данных перед созданием окончательного случайного леса с большим количеством деревьев (, пожалуйста, исправьте и сообщите мне, если это не тот способ использования этого...
вопрос задан: 20 July 2015 21:09
0
ответов

Как написать тестовый шаблон волшебного файла, чтобы он соответствовал концу файла?

Я начинаю задаваться вопросом, возможно ли это даже при многократном поиске в SO, Google , Bing и linuxquestions.org ничего не нашли. Я заинтересован в расширении волшебных шаблонов, расположенных в /...
вопрос задан: 25 May 2015 05:05
0
ответов

Ошибка в матрице путаницы: данные и контрольные факторы должны иметь одинаковое количество уровней

Я тренировал модель линейной регрессии с помощью R. Caret. Сейчас я пытаюсь сгенерировать матрицу путаницы и продолжаю получать следующую ошибку: Ошибка в confusionMatrix.default (пред, тестирование $ Final): ...
вопрос задан: 2 May 2015 12:26
0
ответов

weka.core.UnassignedDatasetException при создании непомеченного экземпляра

Я обучил классификатор IBK некоторыми обучающими данными, которые я создал вручную, следующим образом: ArrayList atts = new ArrayList (); ArrayList classVal = new ...
вопрос задан: 12 December 2014 15:49
0
ответов

Проекты машинного обучения с открытым исходным кодом, ориентированные на веб / браузер?

Применение методов машинного обучения, в частности методов интеллектуального анализа текста, в среде браузера (в основном Javascript) или в качестве веб-приложения не является очень широко обсуждаемой темой. Я хочу ...
вопрос задан: 1 December 2014 19:29
0
ответов

Каковы 15 классификаций типов в C ++?

Во время выступления на конференции CppCon2014 Уолтером Е. Брауном он заявляет, что существует 15 классификаций типов в C ++, которые описывает стандарт. «15 разделов вселенной типов C ++». "пустота ...
вопрос задан: 20 November 2014 06:19
0
ответов

Определить, являются ли два класса линейно разделимыми (алгоритмически в 2D)

Есть два класса, назовем их X и O. Количество элементов, принадлежащих этим классам, равно разбросаны в плоскости xy. Вот пример, когда два класса не являются линейно разделимыми.Это...
вопрос задан: 19 April 2014 19:09
0
ответов

API классификации доменных имен

Мне нужно классифицировать домены по разным категориям, которые обеспечивают наилучшее использование доменное имя. Например, классифицировать «gamez.com» как игровой портал. Есть ли какой-либо сервис, предлагающий классификацию...
вопрос задан: 15 February 2014 09:59
0
ответов

kNN: обучение, тестирование и проверка

Я извлекаю признаки изображения из 10 классов по 1000 изображений в каждом. Поскольку есть 50 функций, которые я могу извлечь, я думаю найти наилучшую комбинацию функций для использования здесь. Обучение, ...
вопрос задан: 2 January 2014 18:40
0
ответов

Сначала PCA или нормализация?

Каков правильный (или лучший) способ предварительной обработки данных при выполнении регрессии или классификации? Нормализация данных -> PCA -> обучение PCA -> нормализовать вывод PCA -> обучение Нормализовать данные ->...
вопрос задан: 25 May 2013 19:44
0
ответов

Почему векторная нормализация может повысить точность кластеризации и классификации?

В Mahout in Action описано, что нормализация может немного повысить точность. Может кто-нибудь объяснить причину, спасибо!
вопрос задан: 3 April 2013 01:08
0
ответов

Как вычислить частоту ошибок по дереву решений?

Кто-нибудь знает, как рассчитать частоту ошибок для дерева решений с помощью R? Я использую функцию rpart().
вопрос задан: 29 January 2013 09:09
0
ответов

интерпретация наивных байесовских результатов

Я начал использовать NaiveBayes / Simple классификатор для классификации (Weka), однако у меня есть некоторые проблемы, которые нужно понять при обучении данных. Набор данных, который я использую, - weather.nominal.arff. Хотя я использую ...
вопрос задан: 5 December 2012 13:52
0
ответов

Расчет IDF (как в TF-IDF)при тестировании?

Насколько я понимаю, IDF используется для подсчета количества документов, в которых есть термин (вроде просто идеи). Вы можете вычислить IDF (вместе с TF)в обучающем наборе, так как у вас есть все документы...
вопрос задан: 18 October 2012 08:22
0
ответов

Агломеративная кластеризация в Matlab

У меня есть простой двухмерный набор данных, который я хочу кластеризовать агломеративным способом (не зная оптимальное количество кластеров для использования). Единственный способ, которым я смог успешно сгруппировать свои данные ...
вопрос задан: 30 September 2012 21:18
0
ответов

Слабый классификатор

Я пытаюсь реализовать приложение, которое использует алгоритм AdaBoost. Я знаю, что AdaBoost использует набор слабых классификаторов, но я не знаю, что это за слабые классификаторы. Можете ли вы объяснить это мне с ...
вопрос задан: 24 August 2012 04:33
0
ответов

Какой алгоритм классификации можно использовать для категоризации документов?

Эй, вот моя проблема. Учитывая набор документов, мне нужно отнести каждый документ к предопределенной категории. Я собирался использовать подход n -грамм для представления текстового -содержания каждого документа и...
вопрос задан: 20 August 2012 01:54
0
ответов

OpenCV и латентный детектор SVM

Мне было интересно, удалось ли кому-нибудь использовать реализацию OpenCV Latent SVM Detector(http://docs.opencv.org/modules/objdetect/doc/latent_svm.html)успешно. Есть пример кода, который...
вопрос задан: 6 August 2012 16:43
0
ответов

Набор данных музыкальных жанров GTZAN [закрыт]

Я хочу протестировать свой алгоритм музыкального жанра в общедоступном наборе данных, чтобы сравнить его с другими ранее существовавшими алгоритмами. В случае MIREX не все данные доступны. Я обнаружил, что набор данных GTZAN доступен в...
вопрос задан: 13 July 2012 07:20
0
ответов

Прогнозы повышения градиента в рабочих средах с низкой -задержкой?

Может ли кто-нибудь порекомендовать стратегию прогнозирования с использованием модели повышения градиента в диапазоне <10 -15 мс (чем быстрее, тем лучше )? Я использовал пакет R gbm, но первое предсказание...
вопрос задан: 2 July 2012 14:33
0
ответов

Наивная байесовская классификация рядов

Как вы классифицируете ряд отдельных ячеек в MATLAB? На данный момент я могу классифицировать отдельные цвета следующим образом: :training = [1;0; -1; -2;4;0;1]; % это пример данных. target _class = ['posi';'zero';'...
вопрос задан: 1 July 2012 10:32
0
ответов

Классификация линий с помощью opencv

Я работаю над проектом классификации изображений, я извлек изогнутые линии из изображения с помощью обнаружения краев, и мне нужно классифицировать их на основе на их кривизну. Например, на изображении ниже есть ...
вопрос задан: 25 June 2012 09:57
0
ответов

Как получить наиболее информативные функции для классификаторов scikit-learn?

Классификаторы в пакетах машинного обучения, таких как liblinear и nltk, предлагают метод show_most_informative_features(), который действительно полезен для отладки функций: viagra = None ok : spam ...
вопрос задан: 23 June 2012 13:19
0
ответов

Push-уведомления Gmail в Rails

Я разрабатываю приложение, в котором пользователи добавляют свои учетные записи Gmail, и выполняю некоторую классификацию их электронных писем. Я хочу получать уведомления, когда на любой из зарегистрированных аккаунтов приходит новое электронное письмо.
вопрос задан: 21 June 2012 08:59