Я создаю некоторые модели прогнозирования на Python и использую реализацию SVM scikits learn. Это было действительно здорово, легко и относительно быстро.
К сожалению, время выполнения меня начинает ограничивать. Я запускаю rbf SVM с полным набором данных от 4 до 5000 с 650 функциями. Каждый запуск занимает около минуты. Но с 5-кратной перекрестной проверкой + поиском по сетке (с использованием грубого или точного поиска) это становится немного невыполнимым для моей задачи. В общем, есть ли у людей какие-либо рекомендации относительно самой быстрой реализации SVM, которую можно использовать в Python? Это или какие-либо способы ускорить мое моделирование?
Я слышал о реализации LIBSVM на графическом процессоре, которая, похоже, может работать. Я не знаю других реализаций SVM для графического процессора, которые можно было бы использовать в Python, но они определенно были бы открыты для других. Кроме того, значительно ли увеличивает время выполнения использование графического процессора?
Я также слышал, что существуют способы аппроксимации rbf SVM с помощью линейной карты функций SVM + в scikits. Не уверен, что люди думают об этом подходе. Опять же, любой, кто использует этот подход, может ли это значительно увеличить время выполнения?
Мы приветствуем все идеи по увеличению скорости работы программы.