Я пытался сгруппировать более крупный набор данных. состоящий из 50000 векторов измерений размерностью 7. Я пытаюсь создать от 30 до 300 кластеров для дальнейшей обработки.
Я безуспешно пробовал следующие реализации кластеризации:
- Pycluster.kcluster (выдает только 1-2 непустых кластера в моем наборе данных)
- scipy.cluster.hierarchy.fclusterdata (работает слишком долго )
- scipy.cluster.vq.kmeans (недостаточно памяти)
- sklearn.cluster.hierarchical.Ward (исполняется слишком долго)
Есть ли другие реализации, которые я могу пропустить?
задан Anony-Mousse 21 September 2012 в 16:41
поделиться