Python KMeans, кластеризирующий слова

Мне интересно выполнять kmeans, кластеризирующийся в списке слов с мерой по расстоянию быть Leveshtein.

1) Я знаю, что существует много платформ там, включая scipy и оранжево, который имеет kmeans реализацию. Однако они все требуют своего рода вектора как данных, которые действительно не соответствуют мне.

2) Мне нужна хорошая реализация кластеризации. Я посмотрел на кластеризацию Python, и поймите, что она не a) возвращает сумму всего расстояния до каждого центроида и b) это не имеет никакого вида итеративного предела или убегать, который гарантирует качество кластеризации. кластеризация Python и кластеризирующийся алгоритм на daniweb действительно не работают на меня.

Кто-то может найти меня хорошим lib? Google не был моим другом

9
задан sadawd 16 March 2010 в 17:29
поделиться

2 ответа

Не совсем ответ на ваш конкретный вопрос, но я рекомендую взглянуть на «Программирование коллективного разума» . В конце каждой главы, например, о кластеризации, дается описание всего лучшего чтения по этой теме.

0
ответ дан 3 November 2019 в 09:30
поделиться

Да, я думаю, что нет хорошей реализации того, что мне нужно.

У меня сумасшедшие требования, например, кэширование расстояний и т.д.

Так что я думаю, что просто напишу свою собственную библиотеку и скоро выпущу ее под GPLv3.

1
ответ дан 3 November 2019 в 09:30
поделиться
Другие вопросы по тегам:

Похожие вопросы: