Может ли кто-нибудь указать мне на инструмент иерархической кластеризации (предпочтительно на Python), который может кластеризовать ~ 1 миллион объектов? Я пробовал hcluster
, а также Orange .
Кластер
имел проблемы с 18k объектами. Orange удалось сгруппировать 18 тыс. Объектов за секунды, но не удалось создать 100 тыс. Объектов (переполнена память и в конечном итоге произошел сбой).
Я работаю на 64-битном процессоре Xeon (2,53 ГГц) и 8 ГБ ОЗУ + 3 ГБ подкачки в Ubuntu 11.10.