У меня есть путаница, но я хочу увеличить масштаб по оси х и оси у для лучшего чтения. для построения матрицы путаницы я использую матрицу смешения sklearn. Поскольку метки классов ...
У меня есть дерево решений, подготовленное с некоторыми данными. import graphviz dot_data = tree.export_graphviz (clf, out_file = None) graph = graphviz.Source (dot_data) graph.render ("iris") dot_data = tree ....
с этой строкой: print (my_model.predict (X.head ())) Я получаю этот вывод: предсказания для следующих 5 домов: LotArea YearBuilt ... BedroomAbvGr TotRmsAbvGrd 0 ...
Я пытаюсь построить knn с sklearns с пользовательской функцией расстояния. моя дистанционная функция: расстояние (X, Y, ** kwargs) Когда я создаю knn, я делаю так: knn = KNeighborsClassifier (...
Я только что установил Python 3.7 на своем Mac (High Sierra v 10.13.2). Когда я запускаю код, который использует sklearn, я получаю следующее сообщение об ошибке: /Library/Frameworks/Python.framework/Versions/3.7/lib/python3 ....
В настоящее время я делаю проект по Fake News Detection и пытаюсь сравнить точность различных алгоритмов, которые я использовал. Теперь у меня есть кривые ROC, которые выглядят так: Пока что я ...
В настоящее время я использую scikit-learn для создания и установки классификатора SVC. Для этого я написал следующий код: clf = SVC (вероятность = True) .fit (X_labeled, Y_labeled) Затем я использую активное обучение ...
У меня есть 2d np.array с 3 столбцами из 4 категорий регистраций. Я хочу реализовать K-средства на этом массиве np с 3 столбцами, чтобы проверить, можно ли автоматически кластеризовать его в 4 3-мерных
Нужно найти функцию python, которая работает следующим образом: R func: proxy :: simil (method = "cosine", by_rows = FALSE), т.е. находит матрицу сходства путем попарного вычисления косинусного расстояния между кадрами данных ...
Я пытался следовать некоторым инструкциям сегодня, и это запускает с комментария R.E.M В SQLPlus, который я вручную копирую в каждой строке и выполняю ее. Это хорошо, у меня нет SQLPlus, у меня есть SQLDeveloper...
При попытке сделать стратифицированное разбиение по столбцу (по категориям) выдает ошибку. Страна ColumnA Колонка Колонка Метка AB 0,2 0,5 0,1 14 CD 0,9 ...
Таким образом, я прошел учебник, предоставленный пользователем здесь для классификации болезней сердца. Следуя инструкции, я столкнулся с проблемой и не могу найти решение. Я получаю сообщение об ошибке: «...
Я очень плохо знаком с машинным обучением, поэтому этот вопрос может показаться глупым. Я следую учебному пособию по классификации текста, но я сталкиваюсь с ошибкой, которую я не имею ни малейшего представления о том, как ее решить. Это ...
Я пытаюсь закодировать таблицу данных с несколькими столбцами для заданного набора категорий ohe1 = OneHotEncoder (Categories = [list_names_data_rest.values], dtype = 'int8') data_rest1 = ohe1.fit_transform (...
Я пытаюсь заменить значения в словаре, используя цикл for. Но это немного особенное, потому что в скобках есть значения. Мой вопрос: как обновить значения, которые находятся внутри скобки для ...
Я написал функцию, которая принимает набор данных (excel / pandas) и некоторые значения, а затем прогнозирует результат с помощью классификатора дерева решений. Я сделал это с помощью sklearn. Можете ли вы помочь мне с этим, я посмотрел ...
У меня проблема с обучением моего кода с использованием Stochastic Gradient Descent и базы данных MNIST. из sklearn.datasets import fetch_mldata из sklearn.linear_model import SGDClassifier mnist = ...
У меня есть огромный набор данных с более чем 300 столбцами, и, поскольку 90% этих столбцов имеют категориальный характер, я решил быстро их кодировать, что привело к набору данных формы (466557, 1778). Я ...
Я написал собственный класс оценки с помощью метода подгонки и преобразования. Я могу создать модель, обучать и прогнозировать, используя модель. Однако при выполнении перекрестной проверки я сталкиваюсь с этой ошибкой: ...
Я пытаюсь использовать SMOTE из пакета imblearn в Python, но у моих данных много недостающих значений, и я получил следующую ошибку: ValueError: Input содержит NaN, бесконечность или значение, слишком большое для ...
Я хочу классифицировать набор данных цветка Iris (я удалил ярлыки, так что теперь его немеченые данные), используя функцию sklearns k-cluster cling. Я сделал модель прогнозирования, и результат кажется ...
Я использую sklearn для очень простой модели регрессии: из наборов данных импорта sklearn, linear_model из sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = ...
Мне нужно кластерные предложения для этого, я преобразовал предложения в векторы, используя td-idf vectorizer, как из sklearn.feature_extraction.text импортировать TfidfVectorizer из sklearn.cluster import ...
Я пытаюсь построить матрицу смешения для y_test_new и y_predicted. Оба они представляют собой массив 1D np типа float32. from sklearn.metrics import confusion_matrix y_test_new = y_test_matrix_fl.astype (...
Я пытаюсь применить функцию learn_curve scikit-learn. Вместо того, чтобы получать точность классификации, применяя кросс-валидацию, мне нужно получить ее на тестовом наборе в качестве функции обучения ...
Иногда я вижу, что люди пишут такой код (полный фрагмент кода можно найти из => http: //scikit-learn.org/stable/auto_examples/ensemble/plot_feature_transformation.html#sphx-glr-auto-examples -...
Я столкнулся с ошибкой памяти с запуском хребта ядра в python со следующей средой, фоном, командой. Цените общественную обратную связь о том, что могло пойти не так. Набор данных: 50k + экземпляры 15 ...