0
ответов

Как бы вы сгруппировали/кластеризовали эти три области в массивах в python?

Итак, у вас есть массив 1 2 3 60 70 80 100 220 230 250 Для лучшего понимания: Как бы вы сгруппировали/кластеризовали три области в массивах в python(v2.6), чтобы получить три массива в этом случае ....
вопрос задан: 6 June 2015 19:51
0
ответов

Как я могу найти центр кластера точек данных?

Допустим, я каждый день в течение прошлого года наносил на карту местоположение вертолета и придумал следующую карту: Любой человек, смотрящий на это, сможет сказать мне, что этот вертолет базируется ...
вопрос задан: 4 June 2015 09:42
0
ответов

Загрузить базу данных ЭКГ по аритмии MIT-BIH в MATLAB

Я работаю над обработкой сигналов ЭКГ с использованием нейронной сети, которая включает распознавание образов. Поскольку мне нужно собрать все данные из Matlab, чтобы использовать их в качестве тестового сигнала, мне трудно ...
вопрос задан: 21 May 2015 21:58
0
ответов

В scikit узнайте, как бороться с данными, перемешанными с числовым и номинальным значением?

Я знаю, что вычисления в scikit -Learn основаны на NumPy, поэтому все представляет собой матрицу или массив. Как этот пакет обрабатывает смешанные данные (числовые и номинальные значения )? Например, товар может...
вопрос задан: 5 May 2015 18:35
0
ответов

Влияние стемминга на частоту термина?

Как термин частоты (TF )и обратная частота документа (IDF )затронуты удалением стоп-слова -и выделением корней? Спасибо!
вопрос задан: 11 March 2014 18:36
0
ответов

сравнение различных библиотек/инструментов машинного обучения (ML) [закрыто]

Последние пару дней я ищу хорошую библиотеку машинного обучения (ML) и к моему удивлению нашел довольно много. Изначально меня интересовали только те библиотеки, которые поддерживают C/C++, но ...
вопрос задан: 23 December 2013 05:55
0
ответов

Вычислить AUC в R?

Учитывая вектор оценок и вектор фактических меток классов, как рассчитать метрику AUC с одним числом для двоичного классификатора на языке R или на простом английском? Страница 9 из «AUC: A Better ...
вопрос задан: 28 September 2013 21:07
0
ответов

Как можно использовать HMM для распознавания рукописного ввода?

Проблема немного отличается от традиционного распознавания рукописного ввода. У меня есть набор данных, состоящий из тысяч следующих. Для одного нарисованного символа у меня есть несколько последовательных (x, y) координат ...
вопрос задан: 9 September 2013 19:22
0
ответов

Дерево решений против наивного байесовского классификатора [закрыто]

Я занимаюсь исследованием различных методов интеллектуального анализа данных и наткнулся на то, что не смог понять. Если у кого-то есть идеи, это было бы здорово. В каких случаях лучше использовать...
вопрос задан: 25 June 2013 19:26
0
ответов

Как найти минимальную поддержку в априорном алгоритме

Когда заданы процентные значения поддержки и достоверности, как я могу найти минимальную поддержку в априорном алгоритме. Например, когда поддержка и уверенность даны как 60% и 60% соответственно...
вопрос задан: 10 May 2013 05:39
0
ответов

Обнаружение выбросов при интеллектуальном анализе данных [закрыто]

У меня есть несколько наборов вопросов относительно обнаружения выбросов: можем ли мы найти выбросы с помощью k-средних и является ли это хорошим подходом? Есть ли какой-либо алгоритм кластеризации, который не принимает никаких входных данных от ...
вопрос задан: 10 January 2013 23:17
0
ответов

Ситуация интеллектуального анализа данных

Предположим, у меня есть данные как упомянуто ниже. 11:00 user1 Brush 11:05 AM user1 Prep Brakfast 11:10 AM user1 съесть завтрак 11:15 AM user1 Принять ванну 11:30 AM user1 Уйти в офис 12:00 user2 Brush 12: ...
вопрос задан: 10 January 2013 06:48
0
ответов

Библиотека машинного обучения для .net аналог Apache Mahout [закрыто]

Существуют ли библиотеки для .net, такие как Mahout. Что вы можете порекомендовать для машинного обучения?
вопрос задан: 15 November 2012 21:04
0
ответов

крупномасштабная библиотека кластеризации, возможно, с привязками к python

Я пытался кластеризовать более крупный набор данных. состоящий из 50000 векторов измерений размерностью 7. Я пытаюсь создать от 30 до 300 кластеров для дальнейшей обработки. Я пробовал...
вопрос задан: 21 September 2012 16:41
0
ответов

Назначения кластеров иногда различаются в двух реализациях DBSCAN.

Я реализовал алгоритм DBSCAN в R, и я сопоставляю назначения кластеров с реализацией DBSCAN библиотеки fpc. Тестирование проводится на синтетических данных, которые генерируются как заданные...
вопрос задан: 19 September 2012 17:51
0
ответов

Как проверить, является ли ядро ​​допустимым

Если я определяю свой собственный метод определения подобия между двумя входными объектами моего классификатора машины опорных векторов и, таким образом, определяю его как свое ядро, как я могу проверить, действительно ли он действителен...
вопрос задан: 2 August 2012 17:08
0
ответов

Javascript и научная обработка? [закрыто]

Matlab, R и Python являются мощными, но либо дорогостоящими, либо медленными для некоторых работ по анализу данных, которые я хотел бы выполнить. Я рассматриваю возможность использования Javascript как из-за скорости, хороших библиотек визуализации, так и
вопрос задан: 25 July 2012 13:40
0
ответов

Проверить, покрывает ли одно регулярное выражение другое регулярное выражение

Я пытаюсь реализовать алгоритм кластеризации текста. Алгоритм группирует похожие строки необработанного текста, заменяя их регулярными выражениями, и агрегирует количество шаблонов, соответствующих каждому регулярному выражению, поэтому...
вопрос задан: 4 July 2012 04:54
0
ответов

Сохранение данных в sklearn

Я использую scikit-learn для кластеризации текстовых документов. Я использую классы CountVectorizer, TfidfTransformer и MiniBatchKMeans, чтобы помочь мне в этом. Новые текстовые документы добавляются в систему все время ...
вопрос задан: 23 June 2012 12:58
0
ответов

Крупномасштабный интеллектуальный анализ данных с помощью Clojure

Я ищу хороший справочник по крупномасштабному интеллектуальному анализу данных с помощью Clojure Я знаю много хороших книг по программированию на clojure (Programming Clojure, Joy of Clojure, ...) хороший текст по интеллектуальному анализу данных ...
вопрос задан: 22 June 2012 17:14
0
ответов

Что такое оценка кластера в WEKA?

Что мы имеем в виду, когда говорим, что оцениваем кластеры в структуре WEKA? Кластеризация — это неконтролируемый подход к группировке объектов. Что мы имеем в виду, когда говорим, что хотим оценить результат?...
вопрос задан: 4 June 2012 09:23
0
ответов

Формула для «Относительного абсолютного ошибка» и «корневая относительная квадратичная ошибка», используемые в машинном обучении (по расчетам Weka)

В программном обеспечении для интеллектуального анализа данных с открытым исходным кодом Weka (написанном на Java), когда я запускаю какой-либо алгоритм интеллектуального анализа данных, такой как линейная регрессия, Weka возвращает модель и некоторые мод
вопрос задан: 27 May 2012 22:06
0
ответов

Как выполнить совместную фильтрацию в R

У меня есть матричные данные, содержащие некоторые нулевые значения. Чтобы заполнить нулевые значения, я хотел бы выполнить совместную фильтрацию. Поскольку я изучаю R, скорее я хотел бы использовать R. Итак, кто-нибудь знает, как ...
вопрос задан: 26 May 2012 14:25
0
ответов

Идея проекта машинного обучения / интеллектуального анализа данных Hadoop? [закрыто]

Я учусь в аспирантуре по информатике (интеллектуальный анализ данных и машинное обучение) и хорошо знаком с ядром Java (> 4 лет). Я прочитал кучу материалов по Hadoop и Map / Reduce. Теперь я хотел бы сделать ...
вопрос задан: 6 May 2012 10:17
0
ответов

Когда важны n -граммов (n>3 ), а не просто биграммы или триграммы?

Мне просто интересно, каково использование n -граммов (n>3)(и частоты их появления ), учитывая вычислительные затраты на их вычисление. Существуют ли какие-либо приложения, в которых биграммы или триграммы...
вопрос задан: 24 April 2012 08:41
0
ответов

Как определить, произошло ли событие/действие из текста?

Мне интересно, есть ли для этого техника НЛП/МО. Предположим, мне дан набор предложений, и я посмотрел фильм. Слышал, фильм отличный, надо посмотреть. Получил билеты на фильм. Я нахожусь в...
вопрос задан: 21 April 2012 16:13
0
ответов

k размер выборки для обучения классификатора ближайшего соседа для каждого класса

Может ли кто-нибудь сказать мне, должны ли размеры выборки обучения для каждого класса быть равными? Могу ли я принять этот сценарий? класс1 класс2 класс3 образцы 400 500 300 или должны ...
вопрос задан: 19 April 2012 08:58
0
ответов

Хранимая процедура или код

Я прошу не мнений, а больше информации о документации. У нас есть много файлов данных (XML, CSV, Plantext и т. д.), и нам нужно их обработать, извлечь из них данные. человек из базы данных предложил использовать ...
вопрос задан: 18 April 2012 20:56
0
ответов

OpenNLP Name Finder

Я использую пример документа NameFinder API OpenNLP. После инициализации средства поиска имен документация использует следующий код для входного текста:для (строкового документа[][] :документов){ для (...
вопрос задан: 16 April 2012 19:33
0
ответов

Какова временная и пространственная сложность алгоритма FP-Growth?

Как рассчитать временную и пространственную сложность алгоритма FP_growth в интеллектуальном анализе данных??
вопрос задан: 26 March 2012 12:58