0
ответов

Преимущества SVM по сравнению с деревьями решений и алгоритмом AdaBoost

Я работаю над бинарной классификацией данных и хочу знать преимущества и недостатки использования метода опорных векторов по сравнению с деревьями решений и алгоритмами Adaptive Boosting.
вопрос задан: 17 May 2012 00:26
0
ответов

Обработка неполных данных (Разреженность данных )в kNN

Я пытаюсь создать простую рекомендательную систему, используя knn. Допустим, у меня есть таблица :User | Книга1 | Книга2 | Книга3 | Книга4 | Книга5 | Книга6 | Книга7 | 1 | 5 | ? | 3 | ? | 4...
вопрос задан: 9 May 2012 23:09
0
ответов

Lucene :исключение -Анализатор запросов обнаружил после «некоторого слова»

Я работаю над проблемой классификации, чтобы классифицировать отзывы о продуктах как положительные, отрицательные или нейтральные согласно данным обучения с использованием Lucene API. Я использую объекты ArrayList of Review -"...
вопрос задан: 21 April 2012 14:41
0
ответов

k размер выборки для обучения классификатора ближайшего соседа для каждого класса

Может ли кто-нибудь сказать мне, должны ли размеры выборки обучения для каждого класса быть равными? Могу ли я принять этот сценарий? класс1 класс2 класс3 образцы 400 500 300 или должны ...
вопрос задан: 19 April 2012 08:58
0
ответов

Интерпретация вывода StringToWordVector() — Weka

Я пытаюсь выполнить классификацию документов с помощью Weka java API. Вот моя структура каталогов файлов данных. +- text_example | +- класс1 | | | 3 html-файла | +- класс2 | | | 1 html-файл | ...
вопрос задан: 18 April 2012 18:51
0
ответов

Именованные объекты как функция категоризации текста?

Почему при существующих методах категоризации текста (под наблюдением) мы не рассматриваем именованные объекты (NE) в тексте как функцию обучения и тестирования? Как вы думаете, можем ли мы повысить точность с помощью...
вопрос задан: 10 April 2012 12:03
0
ответов

Одномерное расстояние Махаланобиса в Python

Я пытался проверить свой код для расчета расстояния Махаланобиса, написанный на Python (и дважды проверить, чтобы сравнить результат в OpenCV) Мои точки данных имеют 1 измерение каждая (5 строк х 1 столбец). ...
вопрос задан: 29 March 2012 23:53
0
ответов

Выбор функций в MATLAB

У меня есть набор данных для классификации текста, готовый для использования в MATLAB. Каждый документ является вектором в этом наборе данных, и размерность этого вектора чрезвычайно высока. В этих случаях люди обычно делают ...
вопрос задан: 29 March 2012 14:02
0
ответов

Создайте пользовательскую матрицу ядра svm с помощью opencv

Мне нужно обучить модель машины опорных векторов, и я хотел бы использовать пользовательскую матрицу ядра вместо предустановленных (например, RBF, Poly и т. д.). Как я могу сделать это (если это возможно) с помощью opencv ...
вопрос задан: 17 March 2012 17:59
0
ответов

Базовая классификация текста с помощью Weka в Java

Я пытаюсь создать классификатор текста в JAVA с помощью Weka. Я прочитал несколько руководств и пытаюсь создать свой собственный классификатор. У меня есть следующие категории: компьютер, спорт, неизвестность и ...
вопрос задан: 14 March 2012 22:25
0
ответов

Классификация строк на основе онтологии

Недавно я начал работать с онтологиями и использую Protege для создания онтологии, которую я также хотел бы использовать для автоматической классификации строк. Ниже приведен очень простой класс ...
вопрос задан: 10 March 2012 15:38
0
ответов

Как классифицировать/категоризировать строки в соответствии с правилами регулярных выражений в Python

Я пишу ETL-скрипт на Python, который получает данные в файлах CSV, проверяет и дезинфицирует данные, а также классифицирует или классифицирует каждую строку в соответствии с некоторыми правил и, наконец, загружает их в ...
вопрос задан: 8 March 2012 19:45
0
ответов

Как классифицировать документы, проиндексированные с помощью lucene

Я классифицировал набор документов с помощью Lucene (поля: контент, категория). У каждого документа есть своя собственная категория, но некоторые из них помечены как некатегоризованные. Есть ли способ классифицировать эти ...
вопрос задан: 27 February 2012 07:05
0
ответов

Какой из параметров в LibSVM является резервной переменной?

Меня немного смущают имена в SVM. Я использую эту библиотеку LibSVM. Есть так много параметров, которые можно установить. Кто-нибудь знает, какая из них является переменной slack? thx
вопрос задан: 21 February 2012 10:00
0
ответов

Классификация SQL

У меня есть система, которая отслеживает, какие документы просматривают пользователи. У каждого документа есть свой идентификатор и кластер, к которому он принадлежит. Моя система отслеживает идентификатор сеанса и количество просмотров. Теперь я хотел б
вопрос задан: 17 February 2012 06:49
0
ответов

Как представить текстовые документы как векторы функций для классификации текста?

У меня около 10 000 текстовых документов. Как представить их в виде векторов признаков, чтобы я мог использовать их для классификации текста? Есть ли какой-нибудь инструмент, который выполняет векторное представление признаков ...
вопрос задан: 14 February 2012 12:15
0
ответов

Извлечение векторов tf-idf с помощью lucene

Я проиндексировал набор документов с помощью lucene. Я также сохранил DocumentTermVector для каждого содержимого документа. Я написал программу и получил вектор частоты термина для каждого документа, но как я могу ...
вопрос задан: 8 February 2012 21:08
0
ответов

Добавление аффинного члена к целевой функции линейной SVM / логистической регрессии

В настоящее время я работаю над проблемой, в которой мне нужно решить либо L2-регуляризованную логистическую регрессию, либо задачу линейной SVM-регрессии L2-reg, где у меня есть добавленная аффинный член. Итак, моя проблема, например: ...
вопрос задан: 8 February 2012 14:35
0
ответов

Визуализация дерева классификации Weka

Я использую несколько наборов данных, доступных онлайн, и пытаюсь визуализировать дерево. Однако он вообще не позволяет мне визуализировать дерево. Не мог бы кто-нибудь подсказать мне, как получить диаграмму дерева в Weka с помощью ...
вопрос задан: 7 February 2012 13:39
0
ответов

Определение классификаторов Trove

Я столкнулся с этой концепцией, используя Python distutils2/packaging. Я погуглил, но не до конца понял идею, поэтому хотел бы получить лучшее объяснение от кого-то более опытного, чтобы лучше ...
вопрос задан: 1 February 2012 10:29
0
ответов

Переподготовка после перекрестной проверки с помощью libsvm

Я знаю, что перекрестная проверка используется для выбора хороших параметров. После их обнаружения мне нужно заново обучить все данные без опции -v. Но проблема, с которой я сталкиваюсь, заключается в том, что после тренировки с -v ...
вопрос задан: 30 January 2012 05:17
0
ответов

Классификация мультиклассов в libsvm [закрыто]

Я работаю с libsvm и мне нужно реализовать классификацию для мультиклассов по принципу "один против всех". Как я могу это сделать? Использует ли это libsvm версии 2011? Я думаю, что мой вопрос не очень понятен. ...
вопрос задан: 29 January 2012 00:21
0
ответов

Как программно определить, относится ли URL-адрес к веб-сайту электронной коммерции или нет?

В проекте есть модуль, который принимает URL-адрес и определяет, относится ли он к веб-сайту электронной коммерции или не связанному с электронной торговлей. Я пробовал следующие подходы: Использование Apache mahout, Классификация: URL ---> ...
вопрос задан: 22 January 2012 15:01
0
ответов

Определить, насколько разные векторы

Я хочу различать векторы данных, чтобы найти похожие. Например: A = [4,5,6,7,8]; В = [4,5,6,6,8]; С = [4,5,6,7,7]; D = [1,2,3,9,9]; E = [1,2,3,9,8]; В предыдущем примере я хочу ...
вопрос задан: 17 January 2012 19:21
0
ответов

Реализация Python OpenCV SVM

Итак, у меня есть матрица с моими образцами изображений (все преобразованные в векторы), которые были запущены через PCA / LDA, и вектор, который обозначает класс, к которому принадлежит каждое изображение. Теперь я хочу использовать класс OpenCV SVM, чт
вопрос задан: 31 December 2011 11:37
0
ответов

Задача машинного обучения: какой инструмент использовать?

В настоящее время я экспериментирую с задачей машинного обучения, которая включает контролируемое обучение модели классификации. На сегодняшний день у меня есть ~ 5 млн обучающих примеров и ~ 5 млн примеров для перекрестной проверки. В каждом примере…
вопрос задан: 24 December 2011 10:48
0
ответов

Как представить текст для классификации в weka?

Подскажите, пожалуйста, как представить атрибут или класс для классификации текста в weka. С помощью какого атрибута я могу сделать классификацию? Частота слов или просто слова? Что можно было бы ...
вопрос задан: 29 November 2011 15:32
0
ответов

Классификация текста по категориям

Я работаю над проблемой классификации текста, я пытаюсь классифицировать набор слов по категориям, да, для классификации доступно множество библиотек, поэтому, пожалуйста, не отвечайте, если вы ...
вопрос задан: 15 November 2011 21:28
0
ответов

Общий подход к разработке алгоритма классификации изображений для мультфильмов Дилберта

В качестве упражнения на саморазвитие я хочу разработать простой алгоритм классификации, который, учитывая конкретную ячейку Карикатура Дилберта способна определить, какие персонажи присутствуют в мультфильме (...
вопрос задан: 15 November 2011 04:10
0
ответов

ОШИБКА При использовании WEKA API в Java-коде: Атрибут класса не установлен?

Я пытаюсь использовать Weka API в своем Java-коде. Я использую классификацию дерева J48 для классификации моего набора данных в базе данных MySQL, но у меня такая ошибка: Попытка добавить драйвер базы данных (JDBC): RmiJdbc.RJDriver - ...
вопрос задан: 14 November 2011 01:34