крупномасштабная библиотека кластеризации, возможно, с привязками к python

Я пытался сгруппировать более крупный набор данных. состоящий из 50000 векторов измерений размерностью 7. Я пытаюсь создать от 30 до 300 кластеров для дальнейшей обработки.

Я безуспешно пробовал следующие реализации кластеризации:

  • Pycluster.kcluster (выдает только 1-2 непустых кластера в моем наборе данных)
  • scipy.cluster.hierarchy.fclusterdata (работает слишком долго )
  • scipy.cluster.vq.kmeans (недостаточно памяти)
  • sklearn.cluster.hierarchical.Ward (исполняется слишком долго)

Есть ли другие реализации, которые я могу пропустить?

6
задан Anony-Mousse 21 September 2012 в 16:41
поделиться