K означает упорядочение между и внутри кластера

Мне интересно, что другие люди делают с кластерным упорядочением K-средних. Я делаю тепловые карты (в основном из данных ChIP-Seq ) и получаю красивые рисунки с помощью специальной функции тепловой карты (на основе встроенной функции тепловой карты R). Однако хотелось бы двух улучшений. Первый - упорядочить кластеры по убыванию среднего значения. Например, следующий код:

fit = kmeans(data, 8, iter.max=50, nstart=10)
d = data.frame(data, symbol)
d = data.frame(d, fit$cluster)
d = d[order(d$fit.cluster),]

дает мне data.frame, упорядоченный по столбцу кластеров. Каков наилучший способ упорядочить строки так, чтобы 8 кластеров располагались в порядке их соответствующих средних значений?

Во-вторых, вы рекомендуете сортировать строки ВНУТРИ каждого кластера от самого высокого среднего значения до самого низкого? Это наложит более организованный взгляд на данные, но может обмануть небрежного наблюдателя, сделав вывод о том, чего ему, возможно, не следует делать. Если вы это рекомендуете, как бы вы сделали это наиболее эффективно?

5
задан Ron Gejman 24 January 2011 в 20:13
поделиться