scikit-learn - список вопросов по программированию scikit-learn

2

ответа

Обнаружение легкой базовой миграции данных

Я использую автоматическую легкую миграцию Базовых Данных успешно. Однако, когда конкретный объект создается во время миграции, я хотел бы заполнить его с некоторыми данными. Конечно, я мог проверить...

scikit-learn

вопрос задан: 12 June 2010 18:22

1

ответ

Как нормализовать массив в NumPy?

Я хотел бы иметь норму одного массива NumPy. Более конкретно, я ищу эквивалентную версию этой функции def normalize (v): norm = np.linalg.norm (v), если norm == 0: ...

normalization statistics scikit-learn numpy python

вопрос задан: 27 April 2019 23:03

1

ответ

Кривая точного восстановления с n-кратной перекрестной проверкой, показывающая стандартное отклонение

Я хочу создать кривую Precision-Recall с 5-кратной перекрестной проверкой, показывающей стандартное отклонение, как в приведенном здесь примере кода кривой ROC. Код ниже (адаптированный из Как построить PR-кривую более 10 ...

python machine-learning scikit-learn cross-validation precision-recall

вопрос задан: 5 April 2019 23:33

1

ответ

Создайте кривую обучения для обучения встраиванию doc2vec

Я пытаюсь оптимизировать количество эпох для обучения встраиванию. И есть ли способ создать кривую обучения для этого процесса. Я могу создать кривую обучения для регулярного наблюдения ...

python machine-learning scikit-learn doc2vec

вопрос задан: 1 April 2019 19:00

1

ответ

Можно ли получить список функций / переменных, используемых в модели, после сохранения файла модели с помощью joblib.dump?

Я построил модель kmeans scikit-learn и вывел ее с помощью команды joblib.dump. Теперь я хочу протестировать его с новым набором данных, но не могу вспомнить функции, которые использовались при сборке. Может ли кто-нибудь ...

machine-learning scikit-learn k-means joblib

вопрос задан: 29 March 2019 14:31

1

ответ

Получение ошибки с помощью RandomForestRegressor

Мой код показан ниже. импорт numpy как np импорт pandas как pd импорт matplotlib.pyplot как plt импорт seaborn как sns #% matplotlib inline из подпроцесса import check_output импорт os время импорта ## ...

python python-3.x scikit-learn random-forest

вопрос задан: 27 March 2019 04:34

1

ответ

Точечная диаграмма одномерных бимодальных данных из sklearn make_blobs ()

Функция sklearn make_blobs () может быть использована для создания изотропных гауссовых капель для кластеризации Я пытаюсь построить данные, сгенерированные функцией make_blobs (). импорт numpy как нп из склеарн ....

python matplotlib scikit-learn scatter-plot

вопрос задан: 25 March 2019 10:52

1

ответ

Ошибка экспорта в Pandas to_excel: объект DataFrame не имеет атрибута data

Я использую следующий код, чтобы попытаться создать фрейм данных из векторизатора Tf-Idf. Вывод векторизатора fit_transform представляет собой разреженную матрицу, поэтому я использую toarray () для преобразования в массив, а затем в pandas ....

python pandas scikit-learn tfidfvectorizer

вопрос задан: 25 March 2019 08:07

1

ответ

Объект Bunch не вызывается - набор данных scikit-learn rcv1

Я хочу разделить поезд и набор тестов для встроенного набора данных RCV1 и применить алгоритм k-средних, однако при попытке разделить данные появляется ошибка, говорящая, что объект связки не может быть вызван из sklearn ....

scikit-learn dataset train-test-split

вопрос задан: 24 March 2019 12:35

1

ответ

Возникло исключение: ModuleNotFoundError при откреплении объектов (с использованием укропа, маринада или JobLib)

Я установил конвейер sklearn, и теперь, когда мне нужно его развернуть, я протравил свой конвейер (пробовал Joblib и укроп тоже). Когда я открою его в другой среде, которая имеет ту же версию укропа, ...

python scikit-learn pickle joblib dill

вопрос задан: 22 March 2019 21:38

1

ответ

Чтение ARFF из ZIP с помощью zipfile и scipy.io.arff

Я хочу обрабатывать довольно большие ARFF-файлы в scikit-learn. Файлы находятся в ZIP-архиве, и я не хочу распаковывать архив в папку перед обработкой. Следовательно, я использую модуль zipfile Python ...

python scikit-learn scipy zipfile arff

вопрос задан: 19 March 2019 07:44

1

ответ

Путаница с разными метками для осей

Я пытался обучить и протестировать наивный байесовский классификатор. Следующее является частью моего кода: из sklearn.feature_extraction.text import CountVectorizer matrix = CountVectorizer (ngram_range = (1,1)) X = ...

python scikit-learn

вопрос задан: 18 March 2019 19:10

1

ответ

Я не умею тренировать модели в sklearn (scikit-learn), используя python

У меня есть файл данных, он содержит данные для прогнозирования приема в MS. он содержит 9 столбец, 8 столбец содержит данные об ученике, а 9-й столбец содержит возможность выбора студента. я новичок и я не ...

machine-learning scikit-learn

вопрос задан: 18 March 2019 19:03

1

ответ

Проблемы с SKLEARN при импорте cross_validation

Я пытаюсь поиграть с машинным обучением, но у меня проблемы с sklearn и импортом cross_validation. Я получаю сообщения об ошибках, в которых говорится, что ImportError: невозможно импортировать имя '...

python scikit-learn cross-validation

вопрос задан: 18 March 2019 16:30

1

ответ

Ошибка импорта Ошибка загрузки DLL постоянно

Я пытался ввести scikit-learn и pytorch, используя их соответствующие команды, указанные в документации: Команды для установки PyTorch: 1) pip3 install https: //download.pytorch.org/whl/cpu / ...

python compiler-errors scikit-learn pytorch

вопрос задан: 18 March 2019 15:50

1

ответ

TimeSeriesSplit - как агрегировать (или разложить) сплиты?

В Интернете есть много примеров, показывающих, как использовать TimeSeriesSplit для создания нескольких наборов обучения / тестов. Тем не менее, они не показывают, как на самом деле объединить их на практике. Например, это ...

python scikit-learn time-series

вопрос задан: 18 March 2019 13:36

1

ответ

Укажите диапазон индексов для поезда Split SciKit-Learn

Я пытаюсь обдумать идею использования последних 30% записей в наборе данных в качестве тестовых примеров Ничего случайного (преднамеренного). Это возможно? Разделить набор данных на поезд / тест: ...

python-3.x tensorflow scikit-learn

вопрос задан: 17 March 2019 18:47

1

ответ

как разбить наборы данных на тренировочные и тестовые данные с помощью sklearn

Я использую в & amp; t наборы данных лиц, основной каталог содержит 40 подкаталогов, каждый подкаталог содержит различные изображения конкретного человека. Я создал список, который содержит подкаталоги ...

image-processing machine-learning scikit-learn deep-learning computer-vision

вопрос задан: 11 March 2019 15:33

1

ответ

Как получить краткое изложение модели машинного обучения (в частности, повышения XG), как на скриншоте ниже?

Я запустил регрессор Xgboost для набора данных, и мне нужна сводка модели (например, R в квадрате, Куртоза и т. Д.), Как на скриншоте. Любая помощь будет оценена. Скриншот

python scikit-learn xgboost

вопрос задан: 9 March 2019 17:32

1

ответ

Создать больший синтетический набор данных на основе меньшего набора данных в Python

У меня есть набор данных с 21000 строк (образцы данных) и 102 столбцов (функции). Я хотел бы иметь больший синтетический набор данных, сгенерированный на основе текущего набора данных, скажем, с 100000 строк, чтобы я мог использовать ...

python machine-learning scikit-learn imputation

вопрос задан: 6 March 2019 16:04

1

ответ

Sklearn PCA: правильная размерность ПК

У меня есть датафрейм, df, который содержит столбец с именем 'event', в котором есть массив 24x24x40. Я хочу: извлечь этот массив NumPy; сплющить его в вектор 1x23040; добавить эту запись как ...

pandas dataframe scikit-learn pca

вопрос задан: 5 March 2019 10:39

1

ответ

Использование Scikit-Learn WhiteKernel для регрессии гауссовских процессов

Существует два способа указать уровень шума для Гауссовой регрессии процесса (GPR) в Scikit-Learn. Первый способ - указать параметр alpha в конструкторе класса ...

python scikit-learn

вопрос задан: 4 March 2019 16:56

1

ответ

Как GridSearchCV в scikit учится выбирать лучшие параметры для k fold

Я бегу оставить одну из перекрестной проверки с помощью Scridit GridSearchCV. После запуска модели я отображаю среднюю ошибку поезда (это означает среднее для моих k сгибов), но когда я смотрю на этот график, он не дает ...

python machine-learning scikit-learn

вопрос задан: 4 March 2019 15:29

1

ответ

Как вернуть top-n вероятность и связанные с ней классы?

В методе sklearn Forext_proba () обычно мы смотрим только на тот, который имеет наибольшую вероятность. Как я могу вывести вероятность для верхних n классов (n> 1)? Например, вывод из функцииgnast_proba () ...

python numpy scikit-learn

вопрос задан: 4 March 2019 14:26

1

ответ

Сравните точность разных моделей

Я пытаюсь построить способ построить график точности различных моделей ML, например, из sklearn import model_selection из sklearn.linear_model import LogisticRegression из sklearn.tree import ...

python-3.x matplotlib plot scikit-learn

вопрос задан: 3 March 2019 02:26

1

ответ

Ошибка изменения формы при использовании регрессии взаимной информации для выбора объекта

Я пытаюсь сделать выбор некоторой функции, используя altern_info_regression с оберткой SelectKBest. Однако я продолжаю сталкиваться с ошибкой, указывающей, что мой список функций должен быть преобразован в 2D ...

python machine-learning scikit-learn feature-selection

вопрос задан: 2 March 2019 06:49

1

ответ

Гауссовский процесс регрессионных оценок доверительных интервалов

Это может быть странным вопросом, но когда регрессии гауссовского процесса видят кучу зашумленных данных без особого сигнала, что они делают? Ниже я беру кучу шумных данных и запускаю два разных ...

scikit-learn statistics regression gaussian

вопрос задан: 2 March 2019 00:16

1

ответ

Как мне автоматизировать количество кластеров? [Дубликат]

Я играл с приведенным ниже сценарием: из sklearn.feature_extraction.text импортировать TfidfVectorizer из sklearn.cluster импортировать KMeans из sklearn.metrics

python machine-learning scikit-learn cluster-analysis

вопрос задан: 1 March 2019 01:01

1

ответ

SVM прогнозирование изображений Python

Я извлек некоторые функции из изображений в своем наборе данных поездов, затем применил эти функции и разделил данные на поезда и протестировал с помощью train_test_split: Train data: (60, 772) Тестовые данные: (20, ...

python image-processing scikit-learn svm

вопрос задан: 28 February 2019 10:39

1

ответ

Изоляционный лес: категориальные данные

Я пытаюсь обнаружить аномалии в наборе данных по раку молочной железы, используя Isolation Forest в sklearn. Я пытаюсь применить Iolation Forest к смешанному набору данных, и он дает мне ошибки в значениях, когда я подгоняю модель ....

python scikit-learn categorical-data outliers anomaly-detection

вопрос задан: 26 February 2019 13:05