1
ответ

стандартный скаляр, не масштабируемый с одинаковым коэффициентом масштабирования [дубликат]

У меня есть список функций (содержащий 5 функций) и вектор результатов, который я использую для обучения. из предварительной обработки импорта sklearn из sklearn.preprocessing import StandardScaler scalar = preprocessing ....
вопрос задан: 30 January 2018 11:43
1
ответ

Организация данных в Pandas - альтернативы OneHot [дубликат]

У меня есть файл excel, который я смог прочитать в dataframe pandas, используя pd.read_excel. Формат фрейма данных выглядит следующим образом: Recycle Num Raw Num Phr 0 Comp1 ...
вопрос задан: 13 November 2017 07:20
1
ответ

Как я могу использовать sklearn.naive_bayes с (несколькими) категориальными функциями?

Я хочу изучить наивную байесовскую модель для задачи, в которой класс является логическим (принимает одно из двух значений). Некоторые функции являются логическими, но другие функции являются категориальными и могут принимать небольшие ...
вопрос задан: 29 July 2016 05:56
1
ответ

Jython не загружает модуль Scikit [дубликат]

Я пытаюсь использовать Jython для извлечения прогнозов из модели Scikit. Но Jyton не может импортировать модуль scikit с нечетным атрибутом AttributeError. Вот исключение Java: Исключение в потоке "...
вопрос задан: 19 June 2015 11:17
1
ответ

передача аргументов в featureUnion transformer_list [duplicate]

Я создаю конвейер sklearn, включая FeatureUnion MyPip = Pipeline ([# другие шаги ('myunion', FeatureUnion (transformer_list = [# Pipeline для вытаскивания функций ...
вопрос задан: 7 January 2015 04:14
1
ответ

sklearn GridSearchCV Отчетность AUC и точность [дубликат]

Я оптимизирую гиперпараметры на основе roc, но я также хочу сообщить о точности модели. Я могу получить roc с атрибутом .best_score_. Есть ли способ получить точность? ...
вопрос задан: 4 August 2014 19:27
1
ответ

Вес функции tf-idf с использованием sklearn.feature_extraction.text.TfidfVectorizer

На этой странице: http://scikit-learn.org/stable/modules/feature_extraction.html упоминается: поскольку tf – idf очень часто используется для текстовых функций, существует также другой класс, называемый TfidfVectorizer, который ...
вопрос задан: 21 May 2014 20:05
1
ответ

Как определить, пересматривает ли нейронная сеть в Scikit Learn [duplicate]

Я тренирую нейронную сеть на Jupyter, используя Sklearn, и у меня возникают проблемы с пониманием того, когда / если моя сеть перегружает данные. Прямо сейчас я планирую фактические результаты моих данных тестирования против ...
вопрос задан: 3 September 2012 20:32
0
ответов

Сохранить модель MinMaxScaler в sklearn

Я использую модель MinMaxScaler в sklearn, чтобы нормализовать возможности модели. training_set = np.random.rand (4,4) * 10 training_set [[6.01144787, 0.59753007, 2.0014852, 3.45433657], ...
вопрос задан: 10 July 2019 21:11
0
ответов

Почему значения этого дерева решений на каждом шаге не суммируются с количеством выборок?

Я читаю о деревьях решений и классификаторах упаковки и пытаюсь показать первое дерево решений, которое используется в классификаторе упаковки. Я запутался в выводе. от склеарн ....
вопрос задан: 12 May 2019 21:07
0
ответов

Развертывание и поддержание состояний моделей машинного обучения [закрыто]

Хорошо, так что я довольно новичок в мире машинного / глубокого обучения и зацикливаюсь на реализации алгоритмов, но у меня есть несколько пробелов, и я хочу понять, как работает индустрия ...
вопрос задан: 2 April 2019 10:30
0
ответов

Как сделать выбор функции в h2oframe?

Я новичок в ml и h2o и действительно нуждаюсь в помощи, чтобы сделать выбор функции как дополнительный регрессор дерева или выбрать k наилучшей формы scikit. но так как scikit не может быть использован в кадре H2O, я должен искать другой путь ...
вопрос задан: 31 March 2019 14:52
0
ответов

Pickle-загрузка более 1 строки файла модели pkl

Файл, о котором идет речь, имеет такие строки при открытии с помощью Notepad ++: € X Neural Networksq. €] q (X ClassificationqKX Team1 winq] q (X Team1qX Team2qe] q (X Team1_rankqX Team2_rankqX Diff1q X ...
вопрос задан: 29 March 2019 06:09
0
ответов

В чем причина различий между SVC с ядром rbf и линейным ядром, которое устанавливается в rbf-ядре computed X

Я запутался в SVC с помощью метода ядра, например, rbf. Я понимаю, что когда SVC с ядром rbf применяется для подгонки (x, y), он вычисляет матрицу ядра rbf K из (x, x.T), форма которой [n_samples, ...
вопрос задан: 28 March 2019 08:33
0
ответов

Как получить одинаковые результаты в разных итерациях в RandomForest в sklearn

Я использую классификатор Random Forest для классификации и на каждой итерации я получаю разные результаты. Мой код выглядит следующим образом. input_file = 'sample.csv' df1 = pd.read_csv (input_file) df2 = pd ....
вопрос задан: 28 March 2019 04:23
0
ответов

Справочная таблица для нормального преобразования счета

Я должен произвести нормальное преобразование счета. Это можно сделать с помощью quantile_transformer. Но я использую STAN (Pystan) в этом проекте и поэтому должен экспортировать справочную таблицу. Я ...
вопрос задан: 25 March 2019 13:30
0
ответов

обмен ошибками измерений в 2d массиве

У меня есть очень большие данные оценки деформаций, которые я импортирую как 2d массивы в Python. Краткий пример: X = np.array ([[210, 211, 209, 10000, 215, -5000], [220, 221, 219, 10000, 225, ...
вопрос задан: 24 March 2019 19:59
0
ответов

Нейронная сеть для нелинейной регрессии

Я пытаюсь выяснить, можно ли разместить нелинейную линию регрессии в наборе данных с помощью нейронной сети. Я нашел некоторые учебники в Интернете, внимательно следил и получил плохие результаты или ...
вопрос задан: 24 March 2019 18:07
0
ответов

Задание не удалось удалить из сериализации

Я продолжаю получать следующую ошибку при попытке запустить некоторые алгоритмы кластеризации: sklearn.externals.joblib.externals.loky.process_executor.BrokenProcessPool: не удалось удалить сериализацию задачи ...
вопрос задан: 24 March 2019 11:44
0
ответов

Как исправить ошибку форм массива Numpy и TPOT?

Я пытаюсь передать функцию и пометить массив numpy в train_test_split. Объекты представляют собой один столбец (дата-время dtype преобразуется в целое число). В массиве меток содержится 900 наблюдений. ...
вопрос задан: 22 March 2019 23:48
0
ответов

Ошибка HTTP 502: время ожидания соединения при использовании Sklearn

Я перепробовал многие из доступных решений, включая fetch_openml (), но до сих пор ничего не получалось, что означает устаревшее? Может кто-нибудь, пожалуйста, помогите решить эту проблему? /usr/local/lib/python3.6/dist -...
вопрос задан: 19 March 2019 16:00
0
ответов

Разница между НЛТК и Скикитом Наивным Байесом

Могу ли я узнать, какова природа Наивного Байеса из НЛТК? Бернулли, полиномиальный, гауссовский или любой другой вариант? Я прочитал документацию, но она кажется слишком общей. Я это понимаю ...
вопрос задан: 14 March 2019 03:10
0
ответов

Не удается получить цвета для синхронизации между Matplotlib pcolormesh и маркером в цикле

Я пытаюсь построить некоторые приблизительные границы (основанные на евклидовом расстоянии до ближайшего центроида кластера с шагом 0,25) между кластерами, используя scikit-learn и matplotlib. Я не могу получить цвета ...
вопрос задан: 10 March 2019 01:43
0
ответов

Как вписать несколько категориальных переменных с их именем столбца

X = train.iloc [:,: -1] .values ​​y = train.iloc [:, -1] .values ​​из sklearn.preprocessing import Imputer imputer = Imputer (missing_values ​​= 'NaN', стратегия = 'most_frequent', ось = 0) # Аппликация ла ...
вопрос задан: 9 March 2019 12:26
0
ответов

pd.get_dummies (df, prefix = None) по-прежнему добавляет имя столбца в качестве префикса

я панда 0.24.1 и пытаюсь преобразовать категориальные данные в числовые данные с помощью get_dummies Я пытаюсь избежать префикса столбца, чтобы я мог объединить повторяющиеся значения в нескольких столбцах. Кто-нибудь имел ...
вопрос задан: 7 March 2019 20:53
0
ответов

DataConversionWarning on sklearn Логистическая регрессия

Я пытаюсь выполнить логистическую регрессию в sklearn ниже: из sklearn.linear_model import Классификатор LogisticRegression = LogisticRegression (random_state = 0) mod_data2 = mod_data.copy () ...
вопрос задан: 5 March 2019 03:23
0
ответов

Как настроить научную фантастику SVR?

Наличие набора данных (50x13). Когда я решил проблему регрессии на WEKA с помощью функции SMOReg, используя параметры по умолчанию, это дает мне коэффициент корреляции 70,49% между входами и выходами. ...
вопрос задан: 3 March 2019 20:32
0
ответов

SVR предсказывает одинаковое значение для всех функций

Я создаю базовое приложение для прогнозирования «цены закрытия» акции на день n + 1, учитывая особенности акции n с использованием Python и Scikit-learn. Пример строки в моем фрейме данных выглядит следующим образом (2000 строк) ...
вопрос задан: 3 March 2019 10:02
0
ответов

Scikit учить MultinomialNaiveBayes Misclassification

Я пытаюсь построить мультиномиальный классификатор NaiveBayes. Получая топ-10 функций для моих меток бинарных классов, я обнаружил, что 8 функций помечены как положительные и отрицательные. Разве это не ...
вопрос задан: 2 March 2019 02:42
0
ответов

Как установить форму средней функции гауссовского процесса с помощью модуля sklearn в Python?

Я хочу сравнить разницу ошибки предсказания между процессом линейного среднего и функцией среднего полинома, используя sklearn.gaussian_process.GaussianProcessRegressor. Тем не менее, только ...
вопрос задан: 20 January 2019 07:32