data-mining - список вопросов по программированию data-mining

0

ответов

Как бы вы сгруппировали/кластеризовали эти три области в массивах в python?

Итак, у вас есть массив 1 2 3 60 70 80 100 220 230 250 Для лучшего понимания: Как бы вы сгруппировали/кластеризовали три области в массивах в python(v2.6), чтобы получить три массива в этом случае ....

вопрос задан: 6 June 2015 19:51

0

ответов

Как я могу найти центр кластера точек данных?

Допустим, я каждый день в течение прошлого года наносил на карту местоположение вертолета и придумал следующую карту: Любой человек, смотрящий на это, сможет сказать мне, что этот вертолет базируется ...

markerclusterer cluster-analysis geocoding algorithm data-mining

вопрос задан: 4 June 2015 09:42

0

ответов

Загрузить базу данных ЭКГ по аритмии MIT-BIH в MATLAB

Я работаю над обработкой сигналов ЭКГ с использованием нейронной сети, которая включает распознавание образов. Поскольку мне нужно собрать все данные из Matlab, чтобы использовать их в качестве тестового сигнала, мне трудно ...

database matlab signal-processing signals data-mining

вопрос задан: 21 May 2015 21:58

0

ответов

В scikit узнайте, как бороться с данными, перемешанными с числовым и номинальным значением?

Я знаю, что вычисления в scikit -Learn основаны на NumPy, поэтому все представляет собой матрицу или массив. Как этот пакет обрабатывает смешанные данные (числовые и номинальные значения )? Например, товар может...

data-mining mixed python scikit-learn machine-learning

вопрос задан: 5 May 2015 18:35

0

ответов

Влияние стемминга на частоту термина?

Как термин частоты (TF )и обратная частота документа (IDF )затронуты удалением стоп-слова -и выделением корней? Спасибо!

data-mining stemming stop-words text-processing tf-idf

вопрос задан: 11 March 2014 18:36

0

ответов

сравнение различных библиотек/инструментов машинного обучения (ML) [закрыто]

Последние пару дней я ищу хорошую библиотеку машинного обучения (ML) и к моему удивлению нашел довольно много. Изначально меня интересовали только те библиотеки, которые поддерживают C/C++, но ...

machine-learning statistics data-mining

вопрос задан: 23 December 2013 05:55

0

ответов

Вычислить AUC в R?

Учитывая вектор оценок и вектор фактических меток классов, как рассчитать метрику AUC с одним числом для двоичного классификатора на языке R или на простом английском? Страница 9 из «AUC: A Better ...

r machine-learning data-mining auc

вопрос задан: 28 September 2013 21:07

0

ответов

Как можно использовать HMM для распознавания рукописного ввода?

Проблема немного отличается от традиционного распознавания рукописного ввода. У меня есть набор данных, состоящий из тысяч следующих. Для одного нарисованного символа у меня есть несколько последовательных (x, y) координат ...

machine-learning data-mining hidden-markov-models handwriting-recognition

вопрос задан: 9 September 2013 19:22

0

ответов

Дерево решений против наивного байесовского классификатора [закрыто]

Я занимаюсь исследованием различных методов интеллектуального анализа данных и наткнулся на то, что не смог понять. Если у кого-то есть идеи, это было бы здорово. В каких случаях лучше использовать...

bayesian-networks data-mining decision-tree

вопрос задан: 25 June 2013 19:26

0

ответов

Как найти минимальную поддержку в априорном алгоритме

Когда заданы процентные значения поддержки и достоверности, как я могу найти минимальную поддержку в априорном алгоритме. Например, когда поддержка и уверенность даны как 60% и 60% соответственно...

apriori data-mining

вопрос задан: 10 May 2013 05:39

0

ответов

Обнаружение выбросов при интеллектуальном анализе данных [закрыто]

У меня есть несколько наборов вопросов относительно обнаружения выбросов: можем ли мы найти выбросы с помощью k-средних и является ли это хорошим подходом? Есть ли какой-либо алгоритм кластеризации, который не принимает никаких входных данных от ...

data-mining svm outliers

вопрос задан: 10 January 2013 23:17

0

ответов

Ситуация интеллектуального анализа данных

Предположим, у меня есть данные как упомянуто ниже. 11:00 user1 Brush 11:05 AM user1 Prep Brakfast 11:10 AM user1 съесть завтрак 11:15 AM user1 Принять ванну 11:30 AM user1 Уйти в офис 12:00 user2 Brush 12: ...

data-mining text-mining

вопрос задан: 10 January 2013 06:48

0

ответов

Библиотека машинного обучения для .net аналог Apache Mahout [закрыто]

Существуют ли библиотеки для .net, такие как Mahout. Что вы можете порекомендовать для машинного обучения?

c# java machine-learning data-mining

вопрос задан: 15 November 2012 21:04

0

ответов

крупномасштабная библиотека кластеризации, возможно, с привязками к python

Я пытался кластеризовать более крупный набор данных. состоящий из 50000 векторов измерений размерностью 7. Я пытаюсь создать от 30 до 300 кластеров для дальнейшей обработки. Я пробовал...

cluster-analysis data-mining python

вопрос задан: 21 September 2012 16:41

0

ответов

Назначения кластеров иногда различаются в двух реализациях DBSCAN.

Я реализовал алгоритм DBSCAN в R, и я сопоставляю назначения кластеров с реализацией DBSCAN библиотеки fpc. Тестирование проводится на синтетических данных, которые генерируются как заданные...

cluster-analysis data-mining dbscan r

вопрос задан: 19 September 2012 17:51

0

ответов

Как проверить, является ли ядро допустимым

Если я определяю свой собственный метод определения подобия между двумя входными объектами моего классификатора машины опорных векторов и, таким образом, определяю его как свое ядро, как я могу проверить, действительно ли он действителен...

data-mining svm machine-learning

вопрос задан: 2 August 2012 17:08

0

ответов

Javascript и научная обработка? [закрыто]

Matlab, R и Python являются мощными, но либо дорогостоящими, либо медленными для некоторых работ по анализу данных, которые я хотел бы выполнить. Я рассматриваю возможность использования Javascript как из-за скорости, хороших библиотек визуализации, так и

data-mining javascript scientific-computing

вопрос задан: 25 July 2012 13:40

0

ответов

Проверить, покрывает ли одно регулярное выражение другое регулярное выражение

Я пытаюсь реализовать алгоритм кластеризации текста. Алгоритм группирует похожие строки необработанного текста, заменяя их регулярными выражениями, и агрегирует количество шаблонов, соответствующих каждому регулярному выражению, поэтому...

cluster-analysis data-mining c++ regex

вопрос задан: 4 July 2012 04:54

0

ответов

Сохранение данных в sklearn

Я использую scikit-learn для кластеризации текстовых документов. Я использую классы CountVectorizer, TfidfTransformer и MiniBatchKMeans, чтобы помочь мне в этом. Новые текстовые документы добавляются в систему все время ...

data-mining python scikit-learn machine-learning

вопрос задан: 23 June 2012 12:58

0

ответов

Крупномасштабный интеллектуальный анализ данных с помощью Clojure

Я ищу хороший справочник по крупномасштабному интеллектуальному анализу данных с помощью Clojure Я знаю много хороших книг по программированию на clojure (Programming Clojure, Joy of Clojure, ...) хороший текст по интеллектуальному анализу данных ...

clojure data-mining

вопрос задан: 22 June 2012 17:14

0

ответов

Что такое оценка кластера в WEKA?

Что мы имеем в виду, когда говорим, что оцениваем кластеры в структуре WEKA? Кластеризация — это неконтролируемый подход к группировке объектов. Что мы имеем в виду, когда говорим, что хотим оценить результат?...

data-mining java weka machine-learning

вопрос задан: 4 June 2012 09:23

0

ответов

Формула для «Относительного абсолютного ошибка» и «корневая относительная квадратичная ошибка», используемые в машинном обучении (по расчетам Weka)

В программном обеспечении для интеллектуального анализа данных с открытым исходным кодом Weka (написанном на Java), когда я запускаю какой-либо алгоритм интеллектуального анализа данных, такой как линейная регрессия, Weka возвращает модель и некоторые мод

data-mining weka machine-learning

вопрос задан: 27 May 2012 22:06

0

ответов

Как выполнить совместную фильтрацию в R

У меня есть матричные данные, содержащие некоторые нулевые значения. Чтобы заполнить нулевые значения, я хотел бы выполнить совместную фильтрацию. Поскольку я изучаю R, скорее я хотел бы использовать R. Итак, кто-нибудь знает, как ...

collaborative-filtering data-mining r

вопрос задан: 26 May 2012 14:25

0

ответов

Идея проекта машинного обучения / интеллектуального анализа данных Hadoop? [закрыто]

Я учусь в аспирантуре по информатике (интеллектуальный анализ данных и машинное обучение) и хорошо знаком с ядром Java (> 4 лет). Я прочитал кучу материалов по Hadoop и Map / Reduce. Теперь я хотел бы сделать ...

hadoop machine-learning data-mining

вопрос задан: 6 May 2012 10:17

0

ответов

Когда важны n -граммов (n>3 ), а не просто биграммы или триграммы?

Мне просто интересно, каково использование n -граммов (n>3)(и частоты их появления ), учитывая вычислительные затраты на их вычисление. Существуют ли какие-либо приложения, в которых биграммы или триграммы...

data-mining nlp nltk n-gram

вопрос задан: 24 April 2012 08:41

0

ответов

Как определить, произошло ли событие/действие из текста?

Мне интересно, есть ли для этого техника НЛП/МО. Предположим, мне дан набор предложений, и я посмотрел фильм. Слышал, фильм отличный, надо посмотреть. Получил билеты на фильм. Я нахожусь в...

data-mining information-retrieval nlp machine-learning

вопрос задан: 21 April 2012 16:13

0

ответов

k размер выборки для обучения классификатора ближайшего соседа для каждого класса

Может ли кто-нибудь сказать мне, должны ли размеры выборки обучения для каждого класса быть равными? Могу ли я принять этот сценарий? класс1 класс2 класс3 образцы 400 500 300 или должны ...

knn classification data-mining machine-learning algorithm

вопрос задан: 19 April 2012 08:58

0

ответов

Хранимая процедура или код

Я прошу не мнений, а больше информации о документации. У нас есть много файлов данных (XML, CSV, Plantext и т. д.), и нам нужно их обработать, извлечь из них данные. человек из базы данных предложил использовать ...

database database-performance data-mining data-processing stored-procedures

вопрос задан: 18 April 2012 20:56

0

ответов

OpenNLP Name Finder

Я использую пример документа NameFinder API OpenNLP. После инициализации средства поиска имен документация использует следующий код для входного текста:для (строкового документа[][] :документов){ для (...

apache data-mining nlp opennlp

вопрос задан: 16 April 2012 19:33

0

ответов

Какова временная и пространственная сложность алгоритма FP-Growth?

Как рассчитать временную и пространственную сложность алгоритма FP_growth в интеллектуальном анализе данных??

algorithm apriori complexity-theory data-mining

вопрос задан: 26 March 2012 12:58