0
ответов

Странная ошибка иерархической кластеризации в R

Моя программа на R выглядит следующим образом: hcluster <- function(dmatrix) { imatrix <- NULL hc <- hclust(dist(dmatrix), method="average") for(h in sort(unique(hc$height))) { hc.index <- ...
вопрос задан: 26 February 2012 21:45
0
ответов

Код DBSCAN на C # или vb.net, для кластерного анализа

Пожалуйста, мне нужна ваша поддержка, чтобы посоветовать библиотеку или код в vb.net или C # .net, который применяет DBSCAN для создания кластера данных на основе запрета. У меня есть данные GPS, и я хочу найти точки стоянки, используя ...
вопрос задан: 25 February 2012 14:14
0
ответов

R: Как наложить круговые диаграммы на «точки» на диаграмме рассеяния в R

Используя RI, я хотел бы заменить точки на 2-мерном графике рассеяния диаграммой круговая диаграмма, отображающая дополнительные значения. Смысл в том, что у меня есть данные временных рядов для сотен элементов (белков) ...
вопрос задан: 10 February 2012 19:05
0
ответов

Использование сглаживания с методом L для определения количества кластеров K-средних

Кто-нибудь пытался применить сглаживание к оценке метрика перед применением L-метода для определения количества кластеров k-средних в наборе данных? Если да, улучшило ли это результаты? Или разрешить ...
вопрос задан: 7 February 2012 18:34
0
ответов

Нахождение минимального значения максимального кластера?

Определить элемент как имеющий: уникальный идентификатор ценность время создания время удаления У меня есть два входных потока: один информирует меня, когда элемент создается, другой информирует меня, когда элемент удаляется. ...
вопрос задан: 3 February 2012 19:48
0
ответов

Как создать бинарную матрицу инвентаризации в строке? (R)

У меня есть датафрейм из 9 столбцов, состоящий из инвентаризации факторов. В каждой строке могут быть заполнены все 9 столбцов (т.е. в этой строке хранится 9 "вещей"), но в большинстве случаев этого не происходит (в большинстве случаев заполнено 3-4 столб
вопрос задан: 24 January 2012 03:30
0
ответов

Как выбрать пороговые значения T1 и T2 для кластеризации Canopy?

Я пытаюсь реализовать алгоритм кластеризации Canopy вместе с K-средними. Я сделал несколько поисков в Интернете, в которых говорится, что нужно использовать кластеризацию Canopy, чтобы ваши начальные точки отправлялись в K-средства, ...
вопрос задан: 15 January 2012 12:12
0
ответов

Кластеризация 2d целочисленных координат в наборы не более N точек

У меня есть несколько точек на относительно небольшая двумерная сетка, охватывающая оба измерения. Координаты могут быть только целыми числами. Мне нужно разделить их на наборы максимум из N точек ...
вопрос задан: 13 January 2012 12:31
0
ответов

Марковский алгоритм кластеризации

Я проработал следующий пример деталей алгоритма марковской кластеризации: http://www.cs.ucsb.edu/~xyan/classes/CS595D-2009winter/MCL_Presentation2.pdf Я чувствую, что у меня есть ...
вопрос задан: 6 January 2012 21:05
0
ответов

с учетом 10 функций y = a + bx и 1000 точек данных (x, y) с округлением до целых чисел, как получить 10 лучших (a, b) кортежей ?

Мы создаем программное обеспечение, которое проверяет комиссию, взимаемую банками с продавцов, которые принимают кредитные и дебетовые карты. Наши клиенты хотят, чтобы мы сообщали им, если обработчик карты переплачивает их. За транзакцию ...
вопрос задан: 22 December 2011 20:36
0
ответов

Кластеризация разреженного набора бинарных векторов

Если у меня есть разреженный набор данных, где каждый элемент описывается вектором из 1000 элементов, каждый элемент этого вектора может быть либо 0, либо 1 (много 0 и немного 1), знаете ли вы какую-нибудь функцию расстояния, которая...
вопрос задан: 20 December 2011 08:40
0
ответов

Объединение различных сходств для создания одного окончательного сходства

Я новичок в системах интеллектуального анализа данных и рекомендаций, теперь пытаюсь создать что-то вроде системы rec для пользователей, у которых есть такие параметры: город образование интерес. Чтобы вычислить сходство между ...
вопрос задан: 20 November 2011 13:28
0
ответов

Библиотека PHP для кластеризации слов / NLP?

Я пытаюсь реализовать довольно тривиальную "взять результаты поиска (как в заголовке и кратком описании), сгруппировать их в значимые именованные группы »на PHP. После нескольких часов поиска в Google и ...
вопрос задан: 2 November 2011 11:45
0
ответов

Корреляционная близость слов

Допустим, у меня есть текстовая расшифровка диалога за период приблизительно. 1 час. Я хочу знать, какие слова встречаются в непосредственной близости друг от друга. Какой тип статистической техники я бы использовал ...
вопрос задан: 23 October 2011 18:28
0
ответов

Какой пакет с открытым исходным кодом для кластеризации документов лучше всего?

Какой пакет с открытым исходным кодом лучше всего подходит для кластеризации большого корпуса документов? Он должен либо сам определять количество кластеров, либо принимать это в качестве параметра. У нас есть большой ...
вопрос задан: 13 October 2011 10:30
0
ответов

Кластеризация с помощью scipy - кластеров через матрицу расстояний, как вернуть исходные объекты

Я не могу найти достаточно простых руководств или описаний по кластеризации в scipy, поэтому я попытаюсь объяснить свою проблему: Я пытаюсь кластеризовать документы (иерархическая агломеративная кластеризация), и ...
вопрос задан: 11 October 2011 10:33
0
ответов

Где найти надежное программное обеспечение/инструмент с открытым исходным кодом для K-медоидов (не k-means)? [закрыто]

Я изучаю алгоритм K-medoids, поэтому извините, если задаю неуместные вопросы. Как я знаю, алгоритм K-medoids реализует кластеризацию K-means, но использует реальные точки данных в качестве центроида ...
вопрос задан: 5 October 2011 20:03
0
ответов

k-means: одинаковые кластеры для каждого выполнения

Можно ли получить одинаковые кластеры kmeans для каждого выполнения для определенного набора данных. Как и для случайного значения, мы можем использовать фиксированное начальное число. Можно ли остановить случайность для кластеризации?
вопрос задан: 21 September 2011 14:04
0
ответов

k-значит реализация кластеризации в Javascript?

Мне нужна Javascript реализация алгоритма кластеризации k-значений. У меня есть только 1-мерные данные и редко более 100 элементов, поэтому производительность не является проблемой. PS: Я смог найти только ...
вопрос задан: 10 September 2011 09:16
0
ответов

Реализация матрицы близости для кластеризации

Пожалуйста, я немного новичок в этой области, поэтому простите меня, если вопрос звучит тривиально или просто . У меня есть группа наборов данных (точнее, сумка слов), и мне нужно сгенерировать матрицу близости, используя ...
вопрос задан: 8 August 2011 20:57
0
ответов

Биссектриса k-означает объяснение алгоритма кластеризации

Мне нужно было написать алгоритм деления пополам k-средних, но я не понимал алгоритм. Я знаю алгоритм k-средних. Можете ли вы объяснить алгоритм, но не на академическом языке. Спасибо.
вопрос задан: 29 July 2011 10:04
0
ответов

Библиотека машинного обучения Java для коммерческого использования? [закрыто]

Кто-нибудь знает хорошую библиотеку машинного обучения Java, которую я могу использовать для коммерческого продукта? К сожалению, Weka и Rapidminer не позволяют этого. Я уже нашел Apache Mahout и Java Data Mininng ...
вопрос задан: 26 July 2011 11:32
0
ответов

Доступен ли алгоритм нечетких C-средних для Python?

У меня есть точки в трехмерном пространстве, и я хотел бы их сгруппировать. Я знаю "кластер" модуля Pythons, но в нем есть только K-Means. Вы знаете модуль, в котором есть FCM (нечеткие C-средние)? (Если вы знаете ...
вопрос задан: 19 July 2011 17:59
0
ответов

Алгоритм размещения объектов в пространстве

У меня есть набор квадратов и прямоугольников разного размера, которые я хочу объединить вместе с помощью PHP в один большой квадрат / прямоугольник. Квадраты обычно представляют собой изображения, которые я хочу превратить в монтаж - ...
вопрос задан: 16 July 2011 02:39
0
ответов

Weka простые назначения кластеризации K-средних

У меня возникла, кажется, простая проблема, но я не могу найти ответа. Я новичок в Weka, но мне кажется, что я провел небольшое исследование по этому поводу (по крайней мере, прочитал первую пару ...
вопрос задан: 13 July 2011 21:32
0
ответов

Теория графов: вычисление коэффициента кластеризации

Я провожу небольшое исследование и дошел до точки, когда вычислил коэффициент кластеризации графа. Согласно этой статье, непосредственно связанной с моим исследованием: Коэффициент кластеризации C (...
вопрос задан: 10 July 2011 22:27
0
ответов

что такое компонент кластеризации solr

Я только что просмотрел вики-страницу solr для кластеризации. Но я не понимаю, в чем преимущество использования кластеризации. Может ли кто-нибудь сказать мне, что на самом деле подсказывает и как оно используется для индексации и ...
вопрос задан: 29 June 2011 11:39
0
ответов

K-средства с действительно большой матрицей

Мне нужно выполнить кластеризацию k-средних на действительно огромной матрице (около 300.000x100.000 значений, что больше 100Гб). Я хочу знать, могу ли я использовать программное обеспечение R для выполнения этого или weka. Мой компьютер ...
вопрос задан: 16 June 2011 13:32
0
ответов

Могу ли я использовать алгоритм K-средних для строки?

Я работаю над проектом Python, в котором изучаю РНК эволюция структуры (представлена ​​в виде строки, например: «(((...)))», где круглые скобки представляют пары оснований). Дело в том, что у меня есть ...
вопрос задан: 9 June 2011 13:36
0
ответов

Кластеризация K-средних WEKA

Кто-нибудь может объяснить, что на самом деле означает результат кластеризации K-средних в WEKA. Например, kMeans Количество итераций: 9 Сумма квадратов ошибок в кластере: 9434.911100488926 Отсутствует ...
вопрос задан: 16 May 2011 06:23