K означает, что не известно количество кластеров? [дубликат]

На этот вопрос уже есть ответ здесь:

Я пытаюсь применить k-средние к набору точки данных высокой размерности (около 50 измерений) и интересовался, есть ли какие-либо реализации, которые находят оптимальное количество кластеров.

Я помню, как где-то читал, что алгоритм обычно делает это так, что расстояние между кластерами максимизируется, а расстояние внутри кластера минимизируется, но я не помню, где я это видел. Было бы здорово, если бы кто-нибудь мог указать мне на какие-либо ресурсы, в которых это обсуждается. В настоящее время я использую SciPy для k-средних, но подойдет и любая связанная библиотека.

Если есть альтернативные способы достижения того же или лучшего алгоритма, пожалуйста, дайте мне знать.

34
задан Legend 7 July 2011 в 18:58
поделиться