Попытка построить линейный набор значений на шкале логарифмического типа [python] [duplicate]

Прежде всего, вы не классифицируете, вы кластеризуете данные. Классификация - это другой процесс.

Алгоритм K-Средств включает случайность при выборе начальных центров кластера. Установив random_state, вам удастся воспроизвести ту же кластеризацию, что и исходные кластерные центры. Однако это не устраняет вашу проблему. Вы хотите, чтобы кластер с id 0 был setosa, 1 был versicolor и т. Д. Это невозможно, потому что алгоритм K-Means не знает этих категорий, он только группирует цветы в зависимости от их сходства. Вы можете создать правило, чтобы определить, какой кластер соответствует какой категории. Например, вы можете сказать, что если более 50% цветов, принадлежащих кластеру, также относятся к категории setosa, то документы этого кластера следует сравнивать с набором документов в категории setosa.

Это лучший способ сделать это, о котором я могу думать. Однако это не так, как мы оцениваем качество кастинга, есть показатели, которые вы можете использовать, например, коэффициент силы. Надеюсь, я помог.

0
задан Rory Daulton 19 January 2019 в 22:41
поделиться

1 ответ

Посмотрите на следующий сайт. Это говорит о том, как вы можете изменить свой код, чтобы заставить его создавать прямую линию для ваших данных. Однако это будет не так точно, как использование изогнутой линии для считывания прогнозов.

Линейная подгонка в матплотлиб

0
ответ дан James McCannon 19 January 2019 в 22:41
поделиться
Другие вопросы по тегам:

Похожие вопросы: