вопросы о методах кластеризации

недавно я приехал изучать кластеризацию в интеллектуальном анализе данных, и я изучал последовательную кластеризацию, иерархическую кластеризацию и k-средние.

Я также читал об утверждении, которое отличает k-среднее от двух других методов кластеризации, говоря, что k-среднее не очень хорошо справляется с номинальными атрибутами, но текст не объясняет этот момент. Пока единственное различие, которое я вижу, это что для K-средних мы будем знать заранее, что нам понадобится ровно K кластеров, в то время как мы не знаем, сколько кластеров нам понадобится для других двух методов кластеризации.

Кто-нибудь может дать мне некоторое представление о том, почему существует такое утверждение, т.е. k-means имеет эту проблему при работе с примерами номинальных атрибутов, и есть ли способ ее преодолеть?

Заранее спасибо.

6
задан Kevin 4 November 2010 в 15:59
поделиться