0
ответов

sklearn не имеет атрибута «наборы данных»

Я начал использовать sckikit-learn для своей работы. Итак, я проходил учебник, который дает стандартную процедуру для загрузки некоторых наборов данных: $ python > > > из наборов данных импорта sklearn > > & ...
вопрос задан: 4 January 2017 15:34
0
ответов

Будет ли объект pandas работать с кластеризацией sklearn kmeans?

набор данных - это пандас. Это sklearn.cluster.KMeans km = KMeans (n_clusters = n_Clusters) km.fit (набор данных) прогноз = km.predict (набор данных) Вот как я решаю, к какому объекту относится ...
вопрос задан: 28 December 2016 18:27
0
ответов

Сохранить классификатор на диск в scikit-learn

Как сохранить обученный наивный байесовский классификатор на диск и использовать его для прогнозирования данных? У меня есть следующий пример программы с веб-сайта scikit-learn: из наборов данных импорта sklearn iris = наборы данных....
вопрос задан: 11 April 2016 16:26
0
ответов

Самая быстрая реализация SVM, которую можно использовать в Python

Я создаю некоторые модели прогнозирования на Python и использую реализацию SVM scikits learn. Это было действительно здорово, легко и относительно быстро. К сожалению, я начинаю становиться ...
вопрос задан: 3 April 2016 07:53
0
ответов

Как импортировать CSV-файл данных в Scikit-Learn?

Насколько я понимаю, scikit-learn принимает данные в формате (n-sample, n-feature), который представляет собой двумерный массив. Предполагая, что у меня есть данные в форме ... Цены на акции индикатор1 индикатор2 2,0 ...
вопрос задан: 16 January 2016 22:01
0
ответов

Визуализация дерева решений (пример из scikit-learn)

Я новичок в использовании sciki-learn, поэтому, пожалуйста, потерпите меня. Я рассматривал пример: http://scikit-learn.org/stable/modules/tree.html#tree >>> из sklearn.datasets импортировать load_iris >...
вопрос задан: 20 October 2015 23:28
0
ответов

Можете ли вы исправить ложный отрицательный показатель в классификаторе в Scikit Learn

Я использую классификатор Random Forest в scikit learn с несбалансированным набором данных из двух классов. Я гораздо больше беспокоюсь о ложных негативах, чем о ложных. Можно ли исправить ложное ...
вопрос задан: 17 September 2015 18:35
0
ответов

Можно ли указать вашу собственную функцию расстояния с помощью scikit-learn K-Means Clustering?

Можно ли указать вашу собственную функцию расстояния с помощью scikit-learn K- Кластеризация средств?
вопрос задан: 24 August 2015 03:19
0
ответов

классификатор sklearn get ValueError: неправильная форма ввода

У меня есть csv, структура является CAT1, CAT2, TITLE, URL, CONTENT, CAT1, CAT2, TITLE, CONTENT на китайском языке. Я хочу обучить LinearSVC или MultinomialNB с X (TITLE) и функцией (CAT1, CAT2), оба получают эту ошибку. ...
вопрос задан: 3 August 2015 04:57
0
ответов

В scikit узнайте, как бороться с данными, перемешанными с числовым и номинальным значением?

Я знаю, что вычисления в scikit -Learn основаны на NumPy, поэтому все представляет собой матрицу или массив. Как этот пакет обрабатывает смешанные данные (числовые и номинальные значения )? Например, товар может...
вопрос задан: 5 May 2015 18:35
0
ответов

scikit Learn :желаемое количество лучших функций (k )не выбрано

Я пытаюсь выбрать лучшие функции, используя хи -квадрат (scikit -Learn 0.10 ). Из 80 обучающих документов я сначала извлекаю 227 признаков, и из этих 227 признаков я хочу выбрать 10 лучших...
вопрос задан: 24 April 2015 20:32
0
ответов

Внедрение SVM, scikits изучают сокращение времени выполнения, самый быстрый svm

Я работаю с scikit-learn над построением некоторых прогнозных моделей с помощью SVM. У меня есть набор данных, содержащий около 5000 примеров и около 700 функций. Я выполняю пятикратную перекрестную проверку с поиском по сетке 18x17 на ...
вопрос задан: 10 January 2015 19:17
0
ответов

Sklearn и GridSearchCV - Ожидается ли получение оптимальных параметров?

Я работал над оптимизацией модели SVR в Scikit-Learn, но не смог понять, как использовать GridSearchCV. Рассмотрим слегка измененный случай примера кода, представленного в ...
вопрос задан: 20 September 2014 13:17
0
ответов

Sklearn SGDClassifier частичная подгонка

Я пытаюсь использовать SGD для классификации большого набора данных. Поскольку данные слишком велики, чтобы поместиться в память, я хотел бы использовать метод part_fit для обучения классификатора. Я выбрал образец набора данных (...
вопрос задан: 14 July 2014 16:15
0
ответов

Scikit-Learn возвращает значения коэффициента детерминации (R ^ 2), меньшие -1

Я делаю простую линейную модель. У меня есть fire = load_data () regr = linear_model.LinearRegression () scores = cross_validation.cross_val_score (regr, fire.data, fire.target, cv = 10, выигрыш = 'r2') печать ...
вопрос задан: 12 April 2014 22:24
0
ответов

Как внутренне работает функцияprelet_proba () sklearn.svm.svc?

Я использую sklearn.svm.svc из Scikit-научиться делать бинарную классификацию. Я использую его функциюgnast_Proba (), чтобы получить оценки вероятности. Может кто-нибудь сказать мне, как предикат_proba () внутренне ...
вопрос задан: 27 February 2013 12:21
0
ответов

GridSearch для оценщика внутри OneVsRestClassifier

Я хочу выполнить GridSearchCV в модели SVC, но для этого используется стратегия «один против всех». Для последней части я могу просто сделать это: model_to_set = OneVsRestClassifier (SVC (kernel = "poly")) Моя проблема заключается в ...
вопрос задан: 28 September 2012 02:55
0
ответов

Python :UnicodeDecodeError :Кодек utf8 не может декодировать байт

Я читаю кучу файлов RTF в строки Python. В НЕКОТОРЫХ текстах я получаю эту ошибку :Traceback (последний последний вызов ):Файл "11.08.py", строка 47, в X = vectorizer....
вопрос задан: 11 August 2012 23:32
0
ответов

TF *IDF для поисковых запросов

Итак, я следил за этими двумя постами на TF *IDF, но немного запутался:http://css.dzone.com/articles/machine-learning-text-featureПо сути, я хочу создать поисковый запрос, содержащий...
вопрос задан: 11 August 2012 02:44
0
ответов

Лучший пакет машинного обучения для Python 3x? [закрыто]

Я был расстроен, увидев, что scikit -Learn не поддерживает Python 3... Есть ли сопоставимый пакет, который кто-нибудь может порекомендовать для Python 3?
вопрос задан: 10 August 2012 23:25
0
ответов

TF -IDF Simple Use -NLTK/Scikit Learn

Хорошо, поэтому я немного смущен. Однако это должен быть простой прямой вопрос. После вычисления TF -IDF Matrix of the Document по всему корпусу я получаю очень похожий результат...
вопрос задан: 8 August 2012 17:47
0
ответов

Как обучение scikit -может выполнять PCA на разреженных данных в формате libsvm?

Я использую scikit -, чтобы научиться выполнять некоторые задачи по уменьшению размеров. Мои обучающие/тестовые данные находятся в формате libsvm. Это большая разреженная матрица в полмиллиона столбцов. Я использую load _svmlight _file function load...
вопрос задан: 4 August 2012 15:16
0
ответов

Простой пример с использованием BernoulliNB (наивного байесовского классификатора )scikit -обучения на питоне -не может объяснить классификацию

Использование scikit -Learn 0.10 Почему следующий тривиальный фрагмент кода :из sklearn.naive _импорт байеса *импорт sklearn из sklearn.naive _импорт байеса *печать sklearn. __версия __X = np.array ([ [1,...
вопрос задан: 4 August 2012 09:59
0
ответов

Python Список нграмм с частотами

Мне нужно получить наиболее популярные нграммы из текста. Длина нграмм должна быть от 1 до 5 слов. Я знаю, как получить биграммы и триграммы. Например: bigram_measures = nltk.collocations.BigramAssocMeasures () ...
вопрос задан: 1 August 2012 16:29
0
ответов

Веб-приложение, использующее scikit -Learn

Я локально обучил классификатор sklearn, и мне нужно создать простое веб-приложение, демонстрирующее его использование. Я полный ноль в разработке веб-приложений и не хочу тратить часы на...
вопрос задан: 22 July 2012 12:55
0
ответов

Невозможно импортировать Scikit -Узнать

Я попытался установить scikit -Learn на свой Linux Mint 12, но потерпел неудачу. Я скачал пакет из http://pypi.python.org/pypi/scikit-learn/и установил с помощью sudo python2.7 setup.py install Затем я...
вопрос задан: 13 July 2012 06:32
0
ответов

Как заставить SVM хорошо работать с отсутствующими данными в scikit -Learn?

Я использую scikit -Learn для некоторого анализа данных, и в моем наборе данных есть некоторые пропущенные значения (, представленные NA ). Я загружаю данные с помощью genfromtxt с dtype='f8' и приступаю к обучению своего классификатора....
вопрос задан: 12 July 2012 02:16
0
ответов

Как получить текст центров кластеров из scikit -Learn KMeans?

У меня есть список строк, которые я использую для соответствия sklearn.cluster.KMeans :X = TfidfVectorizer ().fit _transform (docs )km = KMeans ().fit (X )Теперь я хотел бы получить центры кластеров в их исходной строке...
вопрос задан: 5 July 2012 13:24
0
ответов

Что означает параметр nu в классе SVM Scikit-Learn?

Я следую примеру, показанному в http://scikit-learn.org/stable/auto_examples/svm/plot_oneclass.html#example-svm-plot-oneclass-py, где SVM одного класса используется для обнаружения аномалий. . Теперь это может...
вопрос задан: 27 June 2012 16:30
0
ответов

Scikit -Изучение ошибки памяти логистической регрессии

Я пытаюсь использовать объект LogisticRegression sklearn 0.11, чтобы соответствовать модели на 200 000 наблюдений с примерно 80 000 функциями. Цель состоит в том, чтобы классифицировать краткие текстовые описания по 1 из 800 классов....
вопрос задан: 25 June 2012 18:47