За возможным исключением "коротких", которое возможно является определенной тратой пространства - иногда буквально, они - все лошади для курсов:
[*], Например, в Горячей точке на архитектуре Pentium, float и двойные операции обычно занимают точно то же время , за исключением подразделения.
не становятся слишком срываемыми в использовании памяти этих типов, если Вы действительно не понимаете его. Например:
, Очевидно, существуют определенные вызовы API (например, различные призывы к не-ЦП интенсивные задачи, которые по некоторым причинам берут плавания), куда просто необходимо передать его тип, который он просит...!
Примечание, что Строка не является типом примитива, таким образом, это действительно не принадлежит этого списка.
I admittedly know very little about this subject, but just to point you in a direction:
Стандартный подход включает cor ()
, hclust ()
и plot.hclust ()
.
Я очень рекомендую heatmap.2 из замечательного пакета gplots.
Я зашел на http://www.rseek.org/ , ввел алгоритм Agnes и обнаружил, что пакет CLUSTER на CRAN содержит следующие подробные сведения о функциях AGNES.
Подробности
Агнес полностью описаны в главе 5. Кауфмана и Руссеу (1990). По сравнению с другими агломеративными методы кластеризации, такие как hclust, Агнес имеет следующие особенности: (а) дает агломеративный коэффициент (см. agnes.object), который измеряет количество кластеров структура найдена; и (б) помимо обычное дерево, оно также обеспечивает баннер, новый графический дисплей (см. plot.agnes).
Алгоритм Агнеса строит иерархия кластеров. Во-первых, каждое наблюдение представляет собой небольшой кластер по сам. Кластеры объединяются до тех пор, пока не будет остается один большой кластер, который содержит все наблюдения. На каждом стадии два ближайших кластера объединены в один больший кластер.
Для method = "average" расстояние между двумя кластерами - это среднее значение несходство между пунктами в одном кластере, а точки в другой кластер. В method = "single" мы использовать малейшее различие между точка в первом кластере и точка во втором кластере (ближайшая соседний метод). когда method = "complete", мы используем наибольший несходство между точкой в первый кластер и точка в второй кластер (самый дальний сосед метод).
Кластеризация - довольно обширная тема, и вы найдете множество пакетов для R, которые реализуют ее в той или иной форме. Когда у вас есть и атрибуты, и ковариаты, объединение кластеризации с ординацией иногда может дать больше информации.
Функцию agnes
в пакете cluster легко использовать с матрицей несходства. Просто установите для аргумента "дисс" значение ИСТИНА.
Если вы можете легко вычислить матрицу несходства вне R, то это может быть подходящим вариантом. В противном случае вы можете просто использовать функцию cor
в R для создания матрицы сходства (из которой вы можете получить матрицу несходства путем вычитания из 1).