LibSVM превращает все мои обучающие векторы в вспомогательные, почему?

Я пытаюсь использовать SVM для классификации новостных статей.

Я создал таблицу, которая содержит характеристики (уникальные слова, найденные в документах) как ряды. Я создал отображение весовых векторов с этими функциями. например, если в статье есть слово, которое является частью таблицы векторов признаков, это место помечено как 1 или иначе 0 .

Пример: - Сгенерирована обучающая выборка ...

1 1: 1 2: 1 3: 1 4: 1 5: 1 6: 1 7: 1 8: 1 9: 1 10: 1 11: 1 12: 1 13: 1 14: 1 15: 1 16: 1 17: 1 18: 1 19: 1 20: 1 21: 1 22: 1 23: 1 24: 1 25: 1 26: 1 27: 1 28: 1 29: 1 30: 1

Поскольку это первый документ, здесь представлены все функции.

Я использую 1 , 0 в качестве меток классов.

Я использую svm.Net для классификации.

Я дал ] 300 весовых векторов, вручную классифицируемых как обучающие данные, и сгенерированная модель принимает все векторы в качестве опорных векторов, что, несомненно, является избыточным.

Мои общие характеристики ( уникальные слова / строка count в таблице базы данных векторов функций) равно 7610 .

В чем может быть причина?

Из-за этого мой проект сейчас находится в довольно плохом состоянии. Он классифицирует каждую доступную статью как положительную.

Есть ли в двоичной классификации LibSVM какие-либо ограничения на метку класса?

Я использую 0 , 1 вместо -1 и +1 . Это проблема?

5
задан Regexident 21 February 2013 в 04:18
поделиться