0
ответов

В scikit узнайте, как бороться с данными, перемешанными с числовым и номинальным значением?

Я знаю, что вычисления в scikit -Learn основаны на NumPy, поэтому все представляет собой матрицу или массив. Как этот пакет обрабатывает смешанные данные (числовые и номинальные значения )? Например, товар может...
вопрос задан: 5 May 2015 18:35
0
ответов

Ошибка в матрице путаницы: данные и контрольные факторы должны иметь одинаковое количество уровней

Я тренировал модель линейной регрессии с помощью R. Caret. Сейчас я пытаюсь сгенерировать матрицу путаницы и продолжаю получать следующую ошибку: Ошибка в confusionMatrix.default (пред, тестирование $ Final): ...
вопрос задан: 2 May 2015 12:26
0
ответов

scikit Learn :желаемое количество лучших функций (k )не выбрано

Я пытаюсь выбрать лучшие функции, используя хи -квадрат (scikit -Learn 0.10 ). Из 80 обучающих документов я сначала извлекаю 227 признаков, и из этих 227 признаков я хочу выбрать 10 лучших...
вопрос задан: 24 April 2015 20:32
0
ответов

PCA от Weka выполняется слишком долго

Я пытаюсь использовать Weka для выбора функций с использованием алгоритма PCA. Мое исходное функциональное пространство содержит ~9000 атрибутов в 2700 образцах. Я попытался уменьшить размерность данных с помощью...
вопрос задан: 7 April 2015 09:44
0
ответов

Весовые векторы в алгоритме персептрона в машинном обучении

Я изучаю алгоритм персептрона в машинном обучении. До сих пор я понял следующие вещи о персептроне 1) Это контролируемая методика обучения 2) Он пытается создать гипер ...
вопрос задан: 25 February 2015 17:08
0
ответов

Распознавание изображений OpenCV

Мой проект - проанализировать набор данных, содержащий изображения птиц. После этого программа должна распознать, является ли входное изображение птицей или нет. Я планирую использовать OpenCV с C ++. Может ли кто-то предложить ...
вопрос задан: 25 February 2015 10:04
0
ответов

метафон против soundex против NYSIIS

Я пытаюсь придумать неявную проверку орфографии, которая будет использовать сопоставление входных слов с каким-то более общим фонетическим представлением для учета опечаток, которые могут возникнуть, в основном для...
вопрос задан: 23 February 2015 22:31
0
ответов

Обработка общих синонимов и частей речи с использованием nltk

Я пытаюсь создать общий идентификатор синонимов для слов в предложении, которые являются значимыми (т.е. не «a» или «the»), и я использую набор инструментов для естественного языка (nltk) в python для него. The ...
вопрос задан: 22 February 2015 21:51
0
ответов

Эквивалент Java Mahout в Python

Целью Mahout на основе Java является создание масштабируемых библиотек машинного обучения. Существуют ли какие-либо эквивалентные библиотеки в Python?
вопрос задан: 10 January 2015 14:46
0
ответов

Учебники по обработке естественного языка [закрыто]

Недавно я посетил курс на Coursera по теме «Обработка естественного языка» и много узнал о синтаксическом анализе, IR и других интересных аспектах, таких как вопросы и ответы и т. д., хотя я хорошо усвоил концепции, но…
вопрос задан: 21 December 2014 05:20
0
ответов

weka.core.UnassignedDatasetException при создании непомеченного экземпляра

Я обучил классификатор IBK некоторыми обучающими данными, которые я создал вручную, следующим образом: ArrayList atts = new ArrayList (); ArrayList classVal = new ...
вопрос задан: 12 December 2014 15:49
0
ответов

Проекты машинного обучения с открытым исходным кодом, ориентированные на веб / браузер?

Применение методов машинного обучения, в частности методов интеллектуального анализа текста, в среде браузера (в основном Javascript) или в качестве веб-приложения не является очень широко обсуждаемой темой. Я хочу ...
вопрос задан: 1 December 2014 19:29
0
ответов

Условные случайные поля

Есть ли алгоритм обучения и оптимизации для двумерных (двумерных) условных случайных полей (CRF), подходящий для классификации изображений? Кто-нибудь использовал пакет CRF в R (http: //crf.r-forge.r -...
вопрос задан: 3 September 2014 12:34
0
ответов

Библиотека нейронных сетей с открытым исходным кодом [закрыта]

Я ищу библиотеку нейронной сети с открытым исходным кодом. До сих пор я рассматривал FANN, WEKA и OpenNN. Есть ли другие, на которые я должен смотреть? Критерии, конечно, документация, примеры,...
вопрос задан: 31 August 2014 18:12
0
ответов

Обнаружение аномалий с помощью Python [closed]

Я работаю на веб-хостинге, и моя работа заключается в поиске и очистке взломанных учетных записей. Я считаю, что 90% оболочек \ вредоносных программ \ инъекций - это поиск файлов, которые "неуместны". Например, eval (...
вопрос задан: 18 August 2014 08:16
0
ответов

Искусственный Методы разведки для обнаружения мошенничества в играх

Моя повседневная работа связана с онлайн-браузерной игрой, небольшой, с очень маленьким персоналом. Фактически, большинство наших сотрудников - волонтеры. Сегодня я сосредоточен на одном аспекте. Я хочу создать ...
вопрос задан: 4 August 2014 13:15
0
ответов

Sklearn SGDClassifier частичная подгонка

Я пытаюсь использовать SGD для классификации большого набора данных. Поскольку данные слишком велики, чтобы поместиться в память, я хотел бы использовать метод part_fit для обучения классификатора. Я выбрал образец набора данных (...
вопрос задан: 14 July 2014 16:15
0
ответов

Сети глубокого убеждения против сверточных нейронных сетей

Я новичок в области нейронных сетей, и я хотел бы знать разницу между Deep Belief Networks и Convolutional Networks. Кроме того, существует ли Глубокая Сверточная Сеть, которая является ...
вопрос задан: 3 July 2014 05:38
0
ответов

Определить, являются ли два класса линейно разделимыми (алгоритмически в 2D)

Есть два класса, назовем их X и O. Количество элементов, принадлежащих этим классам, равно разбросаны в плоскости xy. Вот пример, когда два класса не являются линейно разделимыми.Это...
вопрос задан: 19 April 2014 19:09
0
ответов

Как использовать datasets.fetch_mldata () в sklearn?

Я пытаюсь запустить следующий код для краткого алгоритма машинного обучения: import re import argparse import csv из коллекций import Counter из наборов данных sklearn import из набора sklearn из ...
вопрос задан: 25 March 2014 22:50
0
ответов

Как с помощью Python можно классифицировать данные по алгоритму "ближайшего соседа"?

Мне нужно классифицировать некоторые данные по алгоритму "ближайшего соседа" (я надеюсь). Я погуглил эту проблему и нашел много библиотек (в том числе PyML, mlPy и Orange), но не знаю с чего начать. ...
вопрос задан: 15 March 2014 22:00
0
ответов

Как декодировать речевой ввод

Что я хочу сделать, так это создать API, который переводит человеческую речь в формат IPA (Международного фонетического алфавита ). Мой вопрос, где ресурсы о том, как декодировать речь на уровне...
вопрос задан: 4 March 2014 17:20
0
ответов

Каковы основные отличия и преимущества алгоритмов Стемминга Портера и Ланкастера? [закрыто]

Я работаю над задачами классификации документов в java. Оба алгоритма были настоятельно рекомендованы, каковы преимущества и недостатки каждого и какой из них чаще используется в литературе для ...
вопрос задан: 4 March 2014 06:19
0
ответов

Какие ключевые слова больше всего различают две группы людей?

У меня есть база данных ключевых слов, используемых при поиске людьми из разных групп. Что-то вроде: group1person1: x, y, z group1person2: x, z, d ... group2person1: z, d, l ... и так далее, я хочу увидеть ...
вопрос задан: 21 February 2014 17:27
0
ответов

kNN: обучение, тестирование и проверка

Я извлекаю признаки изображения из 10 классов по 1000 изображений в каждом. Поскольку есть 50 функций, которые я могу извлечь, я думаю найти наилучшую комбинацию функций для использования здесь. Обучение, ...
вопрос задан: 2 January 2014 18:40
0
ответов

сравнение различных библиотек/инструментов машинного обучения (ML) [закрыто]

Последние пару дней я ищу хорошую библиотеку машинного обучения (ML) и к моему удивлению нашел довольно много. Изначально меня интересовали только те библиотеки, которые поддерживают C/C++, но ...
вопрос задан: 23 December 2013 05:55
0
ответов

Настройка производительности Mallet CRF SimpleTagger

Вопрос для всех, кто использовал класс SimpleTagger библиотеки Java для условных случайных полей (CRF) из библиотеки Java. Предположим, что я уже использую многопоточность для максимального числа ...
вопрос задан: 11 December 2013 13:11
0
ответов

Как проверить, есть ли на изображении лицо и достаточно ли оно видно

Я не уверен, можно ли решить эту проблему, но мне показалось, что я все равно спросит. В моей компании мы имеем дело с массовыми приёмными лагерями, когда небольшие группы от 5 до 10 человек едут в деревню и набирают людей. ...
вопрос задан: 14 November 2013 21:30
0
ответов

Фреймворк машинного обучения C ++ [закрыто]

Кажется, я не могу найти фреймворк ML / AI на основе C ++, который реализует широкий спектр алгоритмов нейронных сетей. Я использовал Encog для этих целей при работе на Java, но я не вижу ничего, что ...
вопрос задан: 15 October 2013 08:56
0
ответов

Вычислить AUC в R?

Учитывая вектор оценок и вектор фактических меток классов, как рассчитать метрику AUC с одним числом для двоичного классификатора на языке R или на простом английском? Страница 9 из «AUC: A Better ...
вопрос задан: 28 September 2013 21:07