Я работаю над бинарной классификацией данных и хочу знать преимущества и недостатки использования метода опорных векторов по сравнению с деревьями решений и алгоритмами Adaptive Boosting.
Я работаю над проблемой классификации, чтобы классифицировать отзывы о продуктах как положительные, отрицательные или нейтральные согласно данным обучения с использованием Lucene API. Я использую объекты ArrayList of Review -"...
Может ли кто-нибудь сказать мне, должны ли размеры выборки обучения для каждого класса быть равными? Могу ли я принять этот сценарий? класс1 класс2 класс3 образцы 400 500 300 или должны ...
Почему при существующих методах категоризации текста (под наблюдением) мы не рассматриваем именованные объекты (NE) в тексте как функцию обучения и тестирования? Как вы думаете, можем ли мы повысить точность с помощью...
Я пытался проверить свой код для расчета расстояния Махаланобиса, написанный на Python (и дважды проверить, чтобы сравнить результат в OpenCV) Мои точки данных имеют 1 измерение каждая (5 строк х 1 столбец). ...
У меня есть набор данных для классификации текста, готовый для использования в MATLAB. Каждый документ является вектором в этом наборе данных, и размерность этого вектора чрезвычайно высока. В этих случаях люди обычно делают ...
Мне нужно обучить модель машины опорных векторов, и я хотел бы использовать пользовательскую матрицу ядра вместо предустановленных (например, RBF, Poly и т. д.).
Как я могу сделать это (если это возможно) с помощью opencv ...
Я пытаюсь создать классификатор текста в JAVA с помощью Weka.
Я прочитал несколько руководств и пытаюсь создать свой собственный классификатор. У меня есть следующие категории: компьютер, спорт, неизвестность и ...
Недавно я начал работать с онтологиями и использую Protege для создания онтологии, которую я также хотел бы использовать для автоматической классификации строк. Ниже приведен очень простой класс ...
Я пишу ETL-скрипт на Python, который получает данные в файлах CSV, проверяет и дезинфицирует данные, а также классифицирует или классифицирует каждую строку в соответствии с некоторыми правил и, наконец, загружает их в ...
Я классифицировал набор документов с помощью Lucene (поля: контент, категория). У каждого документа есть своя собственная категория, но некоторые из них помечены как некатегоризованные. Есть ли способ классифицировать эти ...
Меня немного смущают имена в SVM. Я использую эту библиотеку LibSVM. Есть так много параметров, которые можно установить. Кто-нибудь знает, какая из них является переменной slack?
thx
У меня есть система, которая отслеживает, какие документы просматривают пользователи. У каждого документа есть свой идентификатор и кластер, к которому он принадлежит. Моя система отслеживает идентификатор сеанса и количество просмотров. Теперь я хотел б
У меня около 10 000 текстовых документов. Как представить их в виде векторов признаков, чтобы я мог использовать их для классификации текста? Есть ли какой-нибудь инструмент, который выполняет векторное представление признаков ...
Я проиндексировал набор документов с помощью lucene. Я также сохранил DocumentTermVector для каждого содержимого документа. Я написал программу и получил вектор частоты термина для каждого документа, но как я могу ...
В настоящее время я работаю над проблемой, в которой мне нужно решить либо L2-регуляризованную логистическую регрессию, либо задачу линейной SVM-регрессии L2-reg, где у меня есть добавленная аффинный член. Итак, моя проблема, например: ...
Я использую несколько наборов данных, доступных онлайн, и пытаюсь визуализировать дерево. Однако он вообще не позволяет мне визуализировать дерево. Не мог бы кто-нибудь подсказать мне, как получить диаграмму дерева в Weka с помощью ...
Я столкнулся с этой концепцией, используя Python distutils2/packaging. Я погуглил, но не до конца понял идею,
поэтому хотел бы получить лучшее объяснение от кого-то более опытного, чтобы лучше ...
Я знаю, что перекрестная проверка используется для выбора хороших параметров. После их обнаружения мне нужно заново обучить все данные без опции -v. Но проблема, с которой я сталкиваюсь, заключается в том, что после тренировки с -v ...
Я работаю с libsvm и мне нужно реализовать классификацию для мультиклассов по принципу "один против всех". Как я могу это сделать?
Использует ли это libsvm версии 2011? Я думаю, что мой вопрос не очень понятен.
...
В проекте есть модуль, который принимает URL-адрес и определяет, относится ли он к веб-сайту электронной коммерции или не связанному с электронной торговлей. Я пробовал следующие подходы: Использование Apache mahout, Классификация: URL ---> ...
Я хочу различать векторы данных, чтобы найти похожие. Например: A = [4,5,6,7,8];
В = [4,5,6,6,8];
С = [4,5,6,7,7]; D = [1,2,3,9,9];
E = [1,2,3,9,8]; В предыдущем примере я хочу ...
Итак, у меня есть матрица с моими образцами изображений (все преобразованные в векторы), которые были запущены через PCA / LDA, и вектор, который обозначает класс, к которому принадлежит каждое изображение. Теперь я хочу использовать класс OpenCV SVM, чт
В настоящее время я экспериментирую с задачей машинного обучения, которая включает контролируемое обучение модели классификации.
На сегодняшний день у меня есть ~ 5 млн обучающих примеров и ~ 5 млн примеров для перекрестной проверки. В каждом примере…
Подскажите, пожалуйста, как представить атрибут или класс для классификации текста в weka. С помощью какого атрибута я могу сделать классификацию? Частота слов или просто слова? Что можно было бы ...
Я работаю над проблемой классификации текста, я пытаюсь классифицировать набор слов по категориям, да, для классификации доступно множество библиотек, поэтому, пожалуйста, не отвечайте, если вы ...
В качестве упражнения на саморазвитие я хочу разработать простой алгоритм классификации, который, учитывая конкретную ячейку Карикатура Дилберта способна определить, какие персонажи присутствуют в мультфильме (...
Я пытаюсь использовать Weka API в своем Java-коде. Я использую классификацию дерева J48 для классификации моего набора данных в базе данных MySQL, но у меня такая ошибка: Попытка добавить драйвер базы данных (JDBC): RmiJdbc.RJDriver - ...