13
ответов

Размер ConfusionMatrix для увеличения [дубликат]

У меня есть путаница, но я хочу увеличить масштаб по оси х и оси у для лучшего чтения. для построения матрицы путаницы я использую матрицу смешения sklearn. Поскольку метки классов ...
вопрос задан: 1 December 2008 22:24
12
ответов

Получить числовые ограничения из sklearn.tree [duplicate]

У меня есть дерево решений, подготовленное с некоторыми данными. import graphviz dot_data = tree.export_graphviz (clf, out_file = None) graph = graphviz.Source (dot_data) graph.render ("iris") dot_data = tree ....
вопрос задан: 22 April 2018 19:04
10
ответов

как распечатать полную таблицу в python? (Jupyter notebook) [дубликат]

с этой строкой: print (my_model.predict (X.head ())) Я получаю этот вывод: предсказания для следующих 5 домов: LotArea YearBuilt ... BedroomAbvGr TotRmsAbvGrd 0 ...
вопрос задан: 23 March 2018 17:52
9
ответов

var, переданный функции kwargs, не обновляется [duplicate]

Я пытаюсь построить knn с sklearns с пользовательской функцией расстояния. моя дистанционная функция: расстояние (X, Y, ** kwargs) Когда я создаю knn, я делаю так: knn = KNeighborsClassifier (...
вопрос задан: 9 November 2012 01:43
9
ответов

новая установка Python 3.7 создает коллекции DeprecationWarning: [duplicate]

Я только что установил Python 3.7 на своем Mac (High Sierra v 10.13.2). Когда я запускаю код, который использует sklearn, я получаю следующее сообщение об ошибке: /Library/Frameworks/Python.framework/Versions/3.7/lib/python3 ....
вопрос задан: 7 February 2012 15:09
7
ответов

Изменение цветов и стилей кривых на графике ROC [дубликат]

В настоящее время я делаю проект по Fake News Detection и пытаюсь сравнить точность различных алгоритмов, которые я использовал. Теперь у меня есть кривые ROC, которые выглядят так: Пока что я ...
вопрос задан: 17 October 2011 21:25
6
ответов

Установите классификатор с большим количеством данных [дубликат]

В настоящее время я использую scikit-learn для создания и установки классификатора SVC. Для этого я написал следующий код: clf = SVC (вероятность = True) .fit (X_labeled, Y_labeled) Затем я использую активное обучение ...
вопрос задан: 14 April 2014 10:30
5
ответов

Нужно ли нам подстраиваться каждый раз, когда мы хотим предсказать использование sklearn? [Дубликат]

Можем ли мы каким-либо образом сохранить классификатор или регрессию после соответствия (), чтобы сократить время для прогнозирования?
вопрос задан: 11 April 2016 16:26
3
ответа

Ввод вручную медиан как центроидов K-средних, в Python

У меня есть 2d np.array с 3 столбцами из 4 категорий регистраций. Я хочу реализовать K-средства на этом массиве np с 3 столбцами, чтобы проверить, можно ли автоматически кластеризовать его в 4 3-мерных
вопрос задан: 27 March 2019 13:09
3
ответа

Python cosine_simility не работает для матрицы с NaN

Нужно найти функцию python, которая работает следующим образом: R func: proxy :: simil (method = "cosine", by_rows = FALSE), т.е. находит матрицу сходства путем попарного вычисления косинусного расстояния между кадрами данных ...
вопрос задан: 17 January 2019 20:18
3
ответа

SQLDeveloper поддерживает выполняющиеся сценарии?

Я пытался следовать некоторым инструкциям сегодня, и это запускает с комментария R.E.M В SQLPlus, который я вручную копирую в каждой строке и выполняю ее. Это хорошо, у меня нет SQLPlus, у меня есть SQLDeveloper...
вопрос задан: 17 July 2009 08:38
2
ответа

Разделить по столбцам (объекту)

При попытке сделать стратифицированное разбиение по столбцу (по категориям) выдает ошибку. Страна ColumnA Колонка Колонка Метка AB 0,2 0,5 0,1 14 CD 0,9 ...
вопрос задан: 27 March 2019 19:12
2
ответа

ValueError: не удалось преобразовать строку в число с плавающей точкой: 'thal'

Таким образом, я прошел учебник, предоставленный пользователем здесь для классификации болезней сердца. Следуя инструкции, я столкнулся с проблемой и не могу найти решение. Я получаю сообщение об ошибке: «...
вопрос задан: 15 March 2019 12:25
2
ответа

длина разреженной матрицы неоднозначна

Я очень плохо знаком с машинным обучением, поэтому этот вопрос может показаться глупым. Я следую учебному пособию по классификации текста, но я сталкиваюсь с ошибкой, которую я не имею ни малейшего представления о том, как ее решить. Это ...
вопрос задан: 11 March 2019 15:40
2
ответа

OneHotEncoder Несколько столбцов

Я пытаюсь закодировать таблицу данных с несколькими столбцами для заданного набора категорий ohe1 = OneHotEncoder (Categories = [list_names_data_rest.values], dtype = 'int8') data_rest1 = ohe1.fit_transform (...
вопрос задан: 5 March 2019 17:07
2
ответа

Обновить значения в скобках в словаре

Я пытаюсь заменить значения в словаре, используя цикл for. Но это немного особенное, потому что в скобках есть значения. Мой вопрос: как обновить значения, которые находятся внутри скобки для ...
вопрос задан: 5 March 2019 01:21
2
ответа

Проверьте правильность классификатора дерева решений с помощью Python

Я написал функцию, которая принимает набор данных (excel / pandas) и некоторые значения, а затем прогнозирует результат с помощью классификатора дерева решений. Я сделал это с помощью sklearn. Можете ли вы помочь мне с этим, я посмотрел ...
вопрос задан: 26 February 2019 15:32
2
ответа

Реализация пользовательской функции потерь в Scikit Learn

Я хочу реализовать пользовательскую функцию потерь в Scikit Learn. Я использую следующий фрагмент кода: def my_custom_loss_func (y_true, y_pred): diff3 = max ((abs (y_true-y_pred)) * y_true) return diff3 Score = ...
вопрос задан: 19 January 2019 14:42
2
ответа

Как исправить & ldquo; ValueError: Найдено входные переменные с непоследовательным количеством выборок: [10000, 60000] & rdquo ;?

У меня проблема с обучением моего кода с использованием Stochastic Gradient Descent и базы данных MNIST. из sklearn.datasets import fetch_mldata из sklearn.linear_model import SGDClassifier mnist = ...
вопрос задан: 18 January 2019 19:00
2
ответа

Python: ошибка памяти при запуске fit_transform с помощью StandardScaler

У меня есть огромный набор данных с более чем 300 столбцами, и, поскольку 90% этих столбцов имеют категориальный характер, я решил быстро их кодировать, что привело к набору данных формы (466557, 1778). Я ...
вопрос задан: 17 January 2019 12:08
2
ответа

Как использовать перекрестную проверку с пользовательской оценкой в ​​sklearn?

Я написал собственный класс оценки с помощью метода подгонки и преобразования. Я могу создать модель, обучать и прогнозировать, используя модель. Однако при выполнении перекрестной проверки я сталкиваюсь с этой ошибкой: ...
вопрос задан: 17 January 2019 10:13
2
ответа

SMOTE с отсутствующими значениями

Я пытаюсь использовать SMOTE из пакета imblearn в Python, но у моих данных много недостающих значений, и я получил следующую ошибку: ValueError: Input содержит NaN, бесконечность или значение, слишком большое для ...
вопрос задан: 13 July 2018 11:57
2
ответа

Определение точности кластеризации k-средних

Я хочу классифицировать набор данных цветка Iris (я удалил ярлыки, так что теперь его немеченые данные), используя функцию sklearns k-cluster cling. Я сделал модель прогнозирования, и результат кажется ...
вопрос задан: 13 July 2018 07:52
2
ответа

внутренняя ошибка gelsd драйвера lwork, требуемое измерение iwork не возвращено [дубликат]

Я использую sklearn для очень простой модели регрессии: из наборов данных импорта sklearn, linear_model из sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = ...
вопрос задан: 23 April 2017 01:11
2
ответа

Можно ли указать функцию расстояния levenshtein с помощью scikit-learn K-Means Clustering? [Дубликат]

Мне нужно кластерные предложения для этого, я преобразовал предложения в векторы, используя td-idf vectorizer, как из sklearn.feature_extraction.text импортировать TfidfVectorizer из sklearn.cluster import ...
вопрос задан: 2 August 2016 14:50
2
ответа

ValueError: метрики классификации не могут обрабатывать сочетание многоклассов и непрерывных целей [дублировать]

Я пытаюсь построить матрицу смешения для y_test_new и y_predicted. Оба они представляют собой массив 1D np типа float32. from sklearn.metrics import confusion_matrix y_test_new = y_test_matrix_fl.astype (...
вопрос задан: 21 May 2016 19:57
2
ответа

scikit-learn: Изучение кривых с проверенной проверкой [дубликат]

Я пытаюсь применить функцию learn_curve scikit-learn. Вместо того, чтобы получать точность классификации, применяя кросс-валидацию, мне нужно получить ее на тестовом наборе в качестве функции обучения ...
вопрос задан: 16 February 2016 11:01
2
ответа

Заменить столбец рядами pandas [duplicate]

Как изменить фигуру (используя pandas): 0 1 \ trans -0.521058 -0.521058 serie -0.521816 -0.521816 recor -0.468133 -0.468133 to: trans serie recor ...
вопрос задан: 27 July 2015 16:15
2
ответа

slicing в python для уменьшения размера [дубликат]

Иногда я вижу, что люди пишут такой код (полный фрагмент кода можно найти из => http: //scikit-learn.org/stable/auto_examples/ensemble/plot_feature_transformation.html#sphx-glr-auto-examples -...
вопрос задан: 4 July 2013 19:30
2
ответа

Python scikit изучает ошибку памяти для хребта ядра [дубликат]

Я столкнулся с ошибкой памяти с запуском хребта ядра в python со следующей средой, фоном, командой. Цените общественную обратную связь о том, что могло пойти не так. Набор данных: 50k + экземпляры 15 ...
вопрос задан: 3 May 2013 04:11