0
ответов

Агломеративная кластеризация в Matlab

У меня есть простой двухмерный набор данных, который я хочу кластеризовать агломеративным способом (не зная оптимальное количество кластеров для использования). Единственный способ, которым я смог успешно сгруппировать свои данные ...
вопрос задан: 30 September 2012 21:18
0
ответов

крупномасштабная библиотека кластеризации, возможно, с привязками к python

Я пытался кластеризовать более крупный набор данных. состоящий из 50000 векторов измерений размерностью 7. Я пытаюсь создать от 30 до 300 кластеров для дальнейшей обработки. Я пробовал...
вопрос задан: 21 September 2012 16:41
0
ответов

Назначения кластеров иногда различаются в двух реализациях DBSCAN.

Я реализовал алгоритм DBSCAN в R, и я сопоставляю назначения кластеров с реализацией DBSCAN библиотеки fpc. Тестирование проводится на синтетических данных, которые генерируются как заданные...
вопрос задан: 19 September 2012 17:51
0
ответов

Каков наиболее эффективный способ определить, являются ли два отрезка частью одного и того же отрезка в пределах допуска?

Изменить :Изменено название. Меня меньше интересует, чтобы два сегмента были одинаковыми, а скорее, если они коллинеарны друг другу, в пределах определенного допуска. Если да, то строки должны группироваться...
вопрос задан: 11 July 2012 11:06
0
ответов

Каково значение формулы полукластеризации в статье Google Pregel?

Алгоритм полукластеризации упоминается в статье Google Pregel. Оценка полукластера рассчитывается по приведенной ниже формуле, где Ic — сумма весов всех внутренних ребер. до н.э...
вопрос задан: 9 July 2012 13:49
0
ответов

Проверить, покрывает ли одно регулярное выражение другое регулярное выражение

Я пытаюсь реализовать алгоритм кластеризации текста. Алгоритм группирует похожие строки необработанного текста, заменяя их регулярными выражениями, и агрегирует количество шаблонов, соответствующих каждому регулярному выражению, поэтому...
вопрос задан: 4 July 2012 04:54
0
ответов

Как указать расстояние метрика, а для kmeans в R?

Я выполняю кластеризацию kmeans в R с двумя требованиями: мне нужно указать мою собственную функцию расстояния, теперь это коэффициент Пирсона. Я хочу выполнить кластеризацию с использованием среднего членов группы как ...
вопрос задан: 2 July 2012 17:45
0
ответов

Кластеризация на стороне сервера для API карт Google v3

В настоящее время я разрабатываю виджет обзора карт Google, который отображает местоположения в виде маркеров на карте. Количество маркеров варьируется от нескольких сотен до тысяч маркеров (до 10000). ...
вопрос задан: 2 July 2012 12:47
0
ответов

API Карт Google v3, множество маркеров, кластеризация и производительность

У меня есть около 5000 маркеров, которые мне нужно отобразить на Google Map. В настоящее время я использую API (v3), и на более медленных машинах возникают проблемы с производительностью, особенно в IE. Я уже сделал следующее, чтобы ...
вопрос задан: 2 July 2012 11:33
0
ответов

Порядок строк в тепловой карте?

Возьмите следующий код: тепловая карта (data.matrix (сигналы), col = colors, breaks = breaks, scale = "none", Colv = NA, labRow = NA) Как я могу извлечь, предварительно вычислить или повторно вычислить порядок строк в тепловой карте ...
вопрос задан: 2 July 2012 11:26
0
ответов

R - 'princomp' может использоваться только с большим количеством единиц, чем переменных

Я использую программное обеспечение R (R-командир) для кластеризации моих данных. У меня есть меньшее подмножество моих данных, содержащее 200 строк и около 800 столбцов. Я получаю следующую ошибку при попытке кластера kmeans и ...
вопрос задан: 2 July 2012 11:21
0
ответов

Экспорт дендрограммы в виде таблицы в R

Я хотел бы экспортировать дендрограмму hclust-из R в таблицу данных, чтобы впоследствии импортировать ее в другую ("домашнюю-сделанную")программное обеспечение. str(unclass(fit))предоставляет текстовый обзор для...
вопрос задан: 2 July 2012 09:32
0
ответов

Тепловые карты в R с использованием функции ggplot - как кластеризовать строки?

В настоящее время я создаю тепловые карты в R с помощью функции ggplot. В приведенном ниже коде я сначала считываю данные в фрейм данных, удаляю все повторяющиеся строки, факторизую поле временной метки, расплавляю фрейм данных (...
вопрос задан: 2 July 2012 09:12
0
ответов

Рассеивание точек в 2D визуализации

У меня есть такой набор точек (которые я кластеризовал с помощью R): 180.06576696, 192.64378568 180.11529253999998, 192.62311824 180.12106092, 191.78020965999997 180.15299478, 192.56909828000002 180....
вопрос задан: 2 July 2012 09:08
0
ответов

R Метрика «чистоты» кластеризации

Я использую пакет fpc в R для выполнения проверки кластера. Я мог бы использовать функцию cluster.stats (), чтобы сравнить мою кластеризацию с внешним разбиением и вычислить несколько показателей, таких как Rand Index, ...
вопрос задан: 2 July 2012 09:02
0
ответов

R рисовать кластеризацию kmeans с тепловой картой

Я хотел бы кластеризовать матрицу с kmeans и иметь возможность построить ее как тепловую карту. Звучит довольно банально, и я видел много подобных сюжетов. Я попытался погуглить, но не нашел способа ...
вопрос задан: 2 July 2012 08:31
0
ответов

Как генерировать плохие случайные числа

Я уверен, что много раз спрашивали обратное, но я не мог найти никаких ответов о том, как генерировать плохие случайные числа. Я хочу написать небольшую программу для кластерного анализа и сгенерировать некоторые ...
вопрос задан: 2 July 2012 08:26
0
ответов

Кластеризация с использованием алгоритма скрытого распределения Дирихле в gensim

Можно ли выполнить кластеризацию в gensim для заданного набора входных данных с помощью LDA? Как я могу это сделать?
вопрос задан: 2 July 2012 08:21
0
ответов

Ошибка памяти при вычислении попарных расстояний в scipy

Я пытаюсь применить иерархическую кластеризацию к моему набору данных, состоящему из 14039 векторов пользователей. Каждый вектор имеет 10 функций, где каждая функция в основном представляет собой частоту тегов, отмеченных этим пользователем....
вопрос задан: 30 June 2012 11:40
0
ответов

K означает нахождение локтя, когда график локтя представляет собой гладкую кривую

Я пытаюсь построить локоть k означает, используя следующий код: загрузить CSDmat %mydata для k = 2:20 opts = statset('MaxIter', 500, 'Display', 'off'); [IDX1,C1,sumd1,D1] = kmeans(CSDmat,k,'...
вопрос задан: 8 June 2012 20:54
0
ответов

Алгоритм обнаружения сообществ/кластеров в сетях - реализован в javascript?

Я ищу реализацию алгоритма обнаружения сообщества в javascript. Подойдет алгоритм Лувена или любой другой.
вопрос задан: 5 June 2012 12:01
0
ответов

Реализация пользовательского агломеративного алгоритма с нуля

Я знаю об алгоритмах агломеративной кластеризации, как они начинаются с каждой точки данных как отдельных кластеров, а затем объединяются точки для формирования кластеров. Теперь у меня есть n-мерное пространство и...
вопрос задан: 27 May 2012 13:54
0
ответов

кластеризация со значениями NA в R

Я был удивлен, узнав, что клара из библиотеки (кластера )разрешает NA. Но в документации к функциям ничего не сказано о том, как она обрабатывает эти значения. Итак, мои вопросы: :Как Клара справляется с АН? Можно...
вопрос задан: 24 May 2012 07:11
0
ответов

Как выполнить кластеризацию по тренду, а не по расстоянию в R?

k-medoids в функции clara() использует расстояние для формирования кластеров, поэтому я получаю следующий шаблон: a <- matrix(c(0,1,3,2,0,.32,1,.5,0 ,.35,1.2,.4,.5,.3,.2,.1,.5,.2,0,-.1), byrow=T, nrow=5) cl <- clara(...
вопрос задан: 11 May 2012 17:13
0
ответов

невозможно найти объект C _kmns при передаче в.Fortran()

Я пытаюсь изменить статистику ::функция kmeans, чтобы она возвращала количество итераций (см. здесь ). Когда я копирую исходник в свой собственный файл, модифицирую функцию и запускаю ее, я получаю ошибку об объекте C _kmns...
вопрос задан: 21 April 2012 07:51
0
ответов

Не удается заставить работать иерархическую кластеризацию scipy

Я написал простой скрипт, предназначенный для иерархической кластеризации простого тестового набора данных. Я обнаружил, что функция fclusterdata может быть кандидатом на объединение моих данных в два кластера. Требуется...
вопрос задан: 26 March 2012 14:17
0
ответов

Графики вывода kmeans (PyCluster impl)

Как на графике работает кластеризация kmeans в python? Я использую пакет PyCluster. allUserVector — это размерный вектор размером n на m, в основном n пользователей с m функциями. импортировать Pycluster как ПК import ...
вопрос задан: 23 March 2012 22:01
0
ответов

Кластеризация графа Networkx

в Networkx, как я могу кластеризовать узлы на основе цвета узлов? Например, у меня 100 узлов, некоторые из них близки к черному, а другие - к белому. В макете графа мне нужны узлы с похожими ...
вопрос задан: 2 March 2012 23:56
0
ответов

расстояние Махаланобиса в кластеризации Kmeans с использованием OpenCV

Я провел кластеризацию Kmeans и обнаружил центры кластеров с помощью OpenCV C ++ API. kmeans (data_points, clusterCount, labels, TermCriteria (CV_TERMCRIT_EPS + CV_TERMCRIT_ITER, 10, 1.0), 3, ...
вопрос задан: 28 February 2012 13:36
0
ответов

Расчет процента дисперсии для k-средних?

На странице в Википедии описан метод локтя для определения количества кластеров в k-средних. Встроенный метод scipy обеспечивает реализацию, но я не уверен, что понимаю, как ...
вопрос задан: 28 February 2012 06:54