2
ответа

Обнаружение легкой базовой миграции данных

Я использую автоматическую легкую миграцию Базовых Данных успешно. Однако, когда конкретный объект создается во время миграции, я хотел бы заполнить его с некоторыми данными. Конечно, я мог проверить...
вопрос задан: 12 June 2010 18:22
1
ответ

Как нормализовать массив в NumPy?

Я хотел бы иметь норму одного массива NumPy. Более конкретно, я ищу эквивалентную версию этой функции def normalize (v): norm = np.linalg.norm (v), если norm == 0: ...
вопрос задан: 27 April 2019 23:03
1
ответ

Кривая точного восстановления с n-кратной перекрестной проверкой, показывающая стандартное отклонение

Я хочу создать кривую Precision-Recall с 5-кратной перекрестной проверкой, показывающей стандартное отклонение, как в приведенном здесь примере кода кривой ROC. Код ниже (адаптированный из Как построить PR-кривую более 10 ...
вопрос задан: 5 April 2019 23:33
1
ответ

Создайте кривую обучения для обучения встраиванию doc2vec

Я пытаюсь оптимизировать количество эпох для обучения встраиванию. И есть ли способ создать кривую обучения для этого процесса. Я могу создать кривую обучения для регулярного наблюдения ...
вопрос задан: 1 April 2019 19:00
1
ответ

Можно ли получить список функций / переменных, используемых в модели, после сохранения файла модели с помощью joblib.dump?

Я построил модель kmeans scikit-learn и вывел ее с помощью команды joblib.dump. Теперь я хочу протестировать его с новым набором данных, но не могу вспомнить функции, которые использовались при сборке. Может ли кто-нибудь ...
вопрос задан: 29 March 2019 14:31
1
ответ

Получение ошибки с помощью RandomForestRegressor

Мой код показан ниже. импорт numpy как np импорт pandas как pd импорт matplotlib.pyplot как plt импорт seaborn как sns #% matplotlib inline из подпроцесса import check_output импорт os время импорта ## ...
вопрос задан: 27 March 2019 04:34
1
ответ

Точечная диаграмма одномерных бимодальных данных из sklearn make_blobs ()

Функция sklearn make_blobs () может быть использована для создания изотропных гауссовых капель для кластеризации Я пытаюсь построить данные, сгенерированные функцией make_blobs (). импорт numpy как нп из склеарн ....
вопрос задан: 25 March 2019 10:52
1
ответ

Ошибка экспорта в Pandas to_excel: объект DataFrame не имеет атрибута data

Я использую следующий код, чтобы попытаться создать фрейм данных из векторизатора Tf-Idf. Вывод векторизатора fit_transform представляет собой разреженную матрицу, поэтому я использую toarray () для преобразования в массив, а затем в pandas ....
вопрос задан: 25 March 2019 08:07
1
ответ

Объект Bunch не вызывается - набор данных scikit-learn rcv1

Я хочу разделить поезд и набор тестов для встроенного набора данных RCV1 и применить алгоритм k-средних, однако при попытке разделить данные появляется ошибка, говорящая, что объект связки не может быть вызван из sklearn ....
вопрос задан: 24 March 2019 12:35
1
ответ

Возникло исключение: ModuleNotFoundError при откреплении объектов (с использованием укропа, маринада или JobLib)

Я установил конвейер sklearn, и теперь, когда мне нужно его развернуть, я протравил свой конвейер (пробовал Joblib и укроп тоже). Когда я открою его в другой среде, которая имеет ту же версию укропа, ...
вопрос задан: 22 March 2019 21:38
1
ответ

Чтение ARFF из ZIP с помощью zipfile и scipy.io.arff

Я хочу обрабатывать довольно большие ARFF-файлы в scikit-learn. Файлы находятся в ZIP-архиве, и я не хочу распаковывать архив в папку перед обработкой. Следовательно, я использую модуль zipfile Python ...
вопрос задан: 19 March 2019 07:44
1
ответ

Путаница с разными метками для осей

Я пытался обучить и протестировать наивный байесовский классификатор. Следующее является частью моего кода: из sklearn.feature_extraction.text import CountVectorizer matrix = CountVectorizer (ngram_range = (1,1)) X = ...
вопрос задан: 18 March 2019 19:10
1
ответ

Я не умею тренировать модели в sklearn (scikit-learn), используя python

У меня есть файл данных, он содержит данные для прогнозирования приема в MS. он содержит 9 столбец, 8 столбец содержит данные об ученике, а 9-й столбец содержит возможность выбора студента. я новичок и я не ...
вопрос задан: 18 March 2019 19:03
1
ответ

Проблемы с SKLEARN при импорте cross_validation

Я пытаюсь поиграть с машинным обучением, но у меня проблемы с sklearn и импортом cross_validation. Я получаю сообщения об ошибках, в которых говорится, что ImportError: невозможно импортировать имя '...
вопрос задан: 18 March 2019 16:30
1
ответ

Ошибка импорта Ошибка загрузки DLL постоянно

Я пытался ввести scikit-learn и pytorch, используя их соответствующие команды, указанные в документации: Команды для установки PyTorch: 1) pip3 install https: //download.pytorch.org/whl/cpu / ...
вопрос задан: 18 March 2019 15:50
1
ответ

TimeSeriesSplit - как агрегировать (или разложить) сплиты?

В Интернете есть много примеров, показывающих, как использовать TimeSeriesSplit для создания нескольких наборов обучения / тестов. Тем не менее, они не показывают, как на самом деле объединить их на практике. Например, это ...
вопрос задан: 18 March 2019 13:36
1
ответ

Укажите диапазон индексов для поезда Split SciKit-Learn

Я пытаюсь обдумать идею использования последних 30% записей в наборе данных в качестве тестовых примеров Ничего случайного (преднамеренного). Это возможно? Разделить набор данных на поезд / тест: ...
вопрос задан: 17 March 2019 18:47
1
ответ

как разбить наборы данных на тренировочные и тестовые данные с помощью sklearn

Я использую в & amp; t наборы данных лиц, основной каталог содержит 40 подкаталогов, каждый подкаталог содержит различные изображения конкретного человека. Я создал список, который содержит подкаталоги ...
вопрос задан: 11 March 2019 15:33
1
ответ

Как получить краткое изложение модели машинного обучения (в частности, повышения XG), как на скриншоте ниже?

Я запустил регрессор Xgboost для набора данных, и мне нужна сводка модели (например, R в квадрате, Куртоза и т. Д.), Как на скриншоте. Любая помощь будет оценена. Скриншот
вопрос задан: 9 March 2019 17:32
1
ответ

Создать больший синтетический набор данных на основе меньшего набора данных в Python

У меня есть набор данных с 21000 строк (образцы данных) и 102 столбцов (функции). Я хотел бы иметь больший синтетический набор данных, сгенерированный на основе текущего набора данных, скажем, с 100000 строк, чтобы я мог использовать ...
вопрос задан: 6 March 2019 16:04
1
ответ

Sklearn PCA: правильная размерность ПК

У меня есть датафрейм, df, который содержит столбец с именем 'event', в котором есть массив 24x24x40. Я хочу: извлечь этот массив NumPy; сплющить его в вектор 1x23040; добавить эту запись как ...
вопрос задан: 5 March 2019 10:39
1
ответ

Использование Scikit-Learn WhiteKernel для регрессии гауссовских процессов

Существует два способа указать уровень шума для Гауссовой регрессии процесса (GPR) в Scikit-Learn. Первый способ - указать параметр alpha в конструкторе класса ...
вопрос задан: 4 March 2019 16:56
1
ответ

Как GridSearchCV в scikit учится выбирать лучшие параметры для k fold

Я бегу оставить одну из перекрестной проверки с помощью Scridit GridSearchCV. После запуска модели я отображаю среднюю ошибку поезда (это означает среднее для моих k сгибов), но когда я смотрю на этот график, он не дает ...
вопрос задан: 4 March 2019 15:29
1
ответ

Как вернуть top-n вероятность и связанные с ней классы?

В методе sklearn Forext_proba () обычно мы смотрим только на тот, который имеет наибольшую вероятность. Как я могу вывести вероятность для верхних n классов (n> 1)? Например, вывод из функцииgnast_proba () ...
вопрос задан: 4 March 2019 14:26
1
ответ

Сравните точность разных моделей

Я пытаюсь построить способ построить график точности различных моделей ML, например, из sklearn import model_selection из sklearn.linear_model import LogisticRegression из sklearn.tree import ...
вопрос задан: 3 March 2019 02:26
1
ответ

Ошибка изменения формы при использовании регрессии взаимной информации для выбора объекта

Я пытаюсь сделать выбор некоторой функции, используя altern_info_regression с оберткой SelectKBest. Однако я продолжаю сталкиваться с ошибкой, указывающей, что мой список функций должен быть преобразован в 2D ...
вопрос задан: 2 March 2019 06:49
1
ответ

Гауссовский процесс регрессионных оценок доверительных интервалов

Это может быть странным вопросом, но когда регрессии гауссовского процесса видят кучу зашумленных данных без особого сигнала, что они делают? Ниже я беру кучу шумных данных и запускаю два разных ...
вопрос задан: 2 March 2019 00:16
1
ответ

Как мне автоматизировать количество кластеров? [Дубликат]

Я играл с приведенным ниже сценарием: из sklearn.feature_extraction.text импортировать TfidfVectorizer из sklearn.cluster импортировать KMeans из sklearn.metrics
вопрос задан: 1 March 2019 01:01
1
ответ

SVM прогнозирование изображений Python

Я извлек некоторые функции из изображений в своем наборе данных поездов, затем применил эти функции и разделил данные на поезда и протестировал с помощью train_test_split: Train data: (60, 772) Тестовые данные: (20, ...
вопрос задан: 28 February 2019 10:39
1
ответ

Изоляционный лес: категориальные данные

Я пытаюсь обнаружить аномалии в наборе данных по раку молочной железы, используя Isolation Forest в sklearn. Я пытаюсь применить Iolation Forest к смешанному набору данных, и он дает мне ошибки в значениях, когда я подгоняю модель ....
вопрос задан: 26 February 2019 13:05