0
ответов

Кластеризация и байесовские классификаторы Matlab

Итак, я на распутье, что делать дальше, я решил изучить и применить некоторые алгоритмы машинного обучения к сложному набору данных, и теперь я сделал это. Мой план с самого начала состоял в том, чтобы...
вопрос задан: 23 May 2017 02:13
0
ответов

Как сгенерировать двумерные данные различной формы (например, квадрат, круг, прямоугольник) с выбросами?

В настоящее время я ищу инструмент, который бы генерировал наборы данных различной формы, такие как квадрат, круг, прямоугольник и т. д. с выбросами для кластерного анализа. Может ли кто-нибудь из вас порекомендовать хороший ...
вопрос задан: 4 May 2017 00:47
0
ответов

кластеризация и matlab

Я пытаюсь сгруппировать некоторые данные, которые у меня есть из набора данных чашки KDD 1999, выходные данные файла выглядят следующим образом: 0, tcp, http, SF, 239,486,0,0,0, 0,0,1,0,0,0,0,0,0,0,0,0,0,8,8,0.00,0.00,0.00,0.00,1.00,0 ....
вопрос задан: 27 January 2017 22:32
0
ответов

Будет ли объект pandas работать с кластеризацией sklearn kmeans?

набор данных - это пандас. Это sklearn.cluster.KMeans km = KMeans (n_clusters = n_Clusters) km.fit (набор данных) прогноз = km.predict (набор данных) Вот как я решаю, к какому объекту относится ...
вопрос задан: 28 December 2016 18:27
0
ответов

Оценка количества кластеров с помощью статистики разрыва и силы прогнозирования

Я пытаюсь перевести R-реализации статистики разрыва и силы предсказания http://edchedch.wordpress.com/2011/03/19/counting-clusters/ в сценарии Python для оценки количества ...
вопрос задан: 8 December 2016 12:05
0
ответов

Оптимально кластеризовать одномерные данные? [закрыто]

Есть ли у кого-нибудь статья, объясняющая, как работает алгоритм Ckmeans.1d.dp? Или: каков наиболее оптимальный способ сделать кластеризацию k-средних в одномерном?
вопрос задан: 9 July 2016 22:08
0
ответов

Python Реализация алгоритма OPTICS (кластеризация)

Я ищу достойную реализацию алгоритм ОПТИКИ на Python. Я буду использовать его для формирования кластеров точек на основе плотности (пары (x, y)). Я ищу что-то, что принимает пары (x, y) ...
вопрос задан: 21 April 2016 18:26
0
ответов

Как выполнить кластеризацию по среднему значению для данных временных рядов?

Как я могу сделать K-средство кластеризации данных временных рядов? Я понимаю, как это работает, когда входные данные представляют собой набор точек, но я не знаю, как кластеризовать временной ряд с 1XM, где M - это данные ...
вопрос задан: 9 February 2016 21:27
0
ответов

Следует ли использовать k-средства ++ вместо k-средних?

Алгоритм k-средних ++ помогает в двух следующие пункты исходного алгоритма k-средних: Исходный алгоритм k-средних имеет наихудшее время работы суперполинома от входного размера, тогда как k -...
вопрос задан: 16 January 2016 21:53
0
ответов

Функция расстояния для смешанных переменных (категориальных и числовых)

Я хочу нечеткую кластеризацию набора заданий. Атрибуты вакансий: Категориальные: должность, диплом, навыки Числовые: зарплата, годы опыта Мой вопрос: как рассчитать расстояние между ...
вопрос задан: 16 January 2016 01:31
0
ответов

Участок 6-D в 2-D в г [закрыт]

Как я могу построить набор данных с 6 измерениями на графике с 2 измерениями. У меня есть набор данных с 6 атрибутами и более 1000 строк, которые я использую для кластеризации k-средних. Теперь я хочу визуализировать ...
вопрос задан: 17 December 2015 15:30
0
ответов

Как работает кластеризация (особенно кластеризация строк)?

Я слышал о кластеризации для группировки похожих данных. Я хочу знать, как это работает в конкретном случае для String. У меня есть таблица с более чем разными 100 000 слов. Я хочу определить одно и то же слово ...
вопрос задан: 30 November 2015 15:51
0
ответов

Adding CURE clustering algorithm to WEKA

I have written a java program to perform CURE clustering. Я хочу добавить эту программу в weka в качестве алгоритма кластеризации и визуализировать кластеризацию. Кто-нибудь уже реализовал это на weka? Любые ссылки ...
вопрос задан: 5 November 2015 16:09
0
ответов

Иерархическая кластеризация 1 миллиона объектов

Может ли кто-нибудь указать мне на инструмент иерархической кластеризации (предпочтительно на Python), который может кластеризовать ~ 1 миллион объектов? Я пробовал hcluster, а также Orange. У hcluster были проблемы с 18к объектами. Оранжевый ...
вопрос задан: 13 October 2015 17:42
0
ответов

Можно ли указать вашу собственную функцию расстояния с помощью scikit-learn K-Means Clustering?

Можно ли указать вашу собственную функцию расстояния с помощью scikit-learn K- Кластеризация средств?
вопрос задан: 24 August 2015 03:19
0
ответов

Показатели качества кластера

Предоставляет ли Matlab какое-либо средство для оценки методов кластеризации? (компактность кластеров и разделение кластеров..... )Или для этого есть какой-нибудь тулбокс?
вопрос задан: 12 July 2015 11:33
0
ответов

Как бы вы сгруппировали/кластеризовали эти три области в массивах в python?

Итак, у вас есть массив 1 2 3 60 70 80 100 220 230 250 Для лучшего понимания: Как бы вы сгруппировали/кластеризовали три области в массивах в python(v2.6), чтобы получить три массива в этом случае ....
вопрос задан: 6 June 2015 19:51
0
ответов

Как я могу найти центр кластера точек данных?

Допустим, я каждый день в течение прошлого года наносил на карту местоположение вертолета и придумал следующую карту: Любой человек, смотрящий на это, сможет сказать мне, что этот вертолет базируется ...
вопрос задан: 4 June 2015 09:42
0
ответов

Веб-библиотека для рисования крупномасштабных графиков [закрыто]

Есть ли хорошая библиотека javascript для рисования графиков на веб-странице? Мне нужна современная библиотека HTML5, которая предпочтительно использует холст и/или webgl. Пока я нашел пару хороших веб-библиотек...
вопрос задан: 23 May 2015 05:51
0
ответов

Группирование похожих новостей вместе, как в GOOGLE NEWS

Я не могу легко управлять RSS-потоками из-за огромного количества новых историй / аналогичных новостей, размещаемых на различных новостных сайтах. Что касается таких тем, как мировые новости и деловые новости, многие из ...
вопрос задан: 4 May 2015 15:33
0
ответов

Как кластерировать экземпляр с DBSCAN DBSCAN?

Я пытался использовать Cluster Cluster DBSCAN из INKA для экземпляров кластеров. Из того, что я понимаю, я должен использовать метод ClusterInstance () для этого, но к моему удивлению, при взгляде на ...
вопрос задан: 9 June 2014 19:33
0
ответов

Кластерный анализ в R: определить оптимальное количество кластеров

Будучи новичком в R, я не очень уверен, как выбрать лучшее количество кластеров для анализа k-средних. После построения подмножества данных ниже, сколько кластеров будет уместным? Как я могу ...
вопрос задан: 6 May 2014 16:07
0
ответов

Есть ли опция seqFileDir для «clusterdump» в последней библиотеке «apache mahout»?

Я пытаюсь сделать «clusterdump» на выходе примера кластеризации mahout kmeans (пример synthetic_control). Но я получаю следующую ошибку: > ~/MAHOUT/trunk/bin/mahout clusterdump ...
вопрос задан: 26 April 2014 10:41
0
ответов

Входная матрица для кластеризации kmeans opencv

Этот вопрос специфичен для opencv: Пример kmeans, приведенный в документации opencv, имеет 2-канальную матрицу — по одному каналу для каждого измерения вектора признаков. Но, некоторые другие примеры...
вопрос задан: 28 January 2014 15:12
0
ответов

kmeans: шаги ступени быстрого переноса превысили максимум

Я запускаю кластеризацию k-средних в R на наборе данных с 636 688 строками и 7 столбцами, используя стандартный пакет статистики: kmeans (набор данных, центры = 100, nstart = 25, iter.max = 20) Я получаю следующее ...
вопрос задан: 27 January 2014 13:57
0
ответов

Как расширить относительные пути в сценарии оболочки

Я пишу скрипт для установки переменных среды в Linux 2.6 с помощью bash. Итак, скрипт содержит такие команды, как :export SRC _DIR=.. export LIBPATH=${SRC _DIR}/lib проблема в том, что когда я пытаюсь сделать...
вопрос задан: 1 September 2013 06:33
0
ответов

Построение дендрограммы в Scipy с ошибкой для большого набора данных

Я использую Scipy для иерархической кластеризации. Мне удается получить плоские кластеры на пороге, используя fcluster. Но мне нужно визуализировать сформированную дендрограмму. Когда я использую метод дендрограммы, он работает...
вопрос задан: 3 August 2013 02:06
0
ответов

Эквивалент функции качества кластера в Matlab?

MATLAB имеет красивую функцию силуэта, которая помогает оценить количество кластеров для k-средних. Есть ли аналог для Python Numpy / Scipy?
вопрос задан: 6 May 2013 15:03
0
ответов

Отображение дендрограмм TraMineR (R )в текстовом/табличном формате

Я использую следующий код R для создания дендрограммы (см. прикрепленное изображение )с метками на основе последовательностей TraMineR :библиотека (TraMineR )библиотека (кластер )clusterward < -agnes (twitter.om, diss = TRUE,...
вопрос задан: 6 April 2013 08:41