Я новичок в R и SVM, и я пытаюсь профилировать svm
из пакета e1071
. Однако я не могу найти большой набор данных, который позволил бы мне получить хороший диапазон результатов профилирования, варьируя размер входных данных. Кто-нибудь знает, как работать с svm
? Какой набор данных следует использовать? Какие-нибудь особые параметры для svm
, которые усложняют его работу?
Я копирую некоторые команды, которые использую для проверки производительности. Возможно, наиболее полезно и просто получить то, что я пытаюсь сделать здесь:
#loading libraries
library(class)
library(e1071)
#I've been using golubEsets (more examples availables)
library(golubEsets)
#get the data: matrix 7129x38
data(Golub_Train)
n <- exprs(Golub_Train)
#duplicate rows(to make the dataset larger)
n<-rbind(n,n)
#take training samples as a vector
samplelabels <- as.vector(Golub_Train@phenoData@data$ALL.AML)
#calculate svm and profile it
Rprof('svm.out')
svmmodel1 <- svm(x=t(n), y=samplelabels, type='C', kernel="radial", cross=10)
Rprof(NULL)
Я продолжаю увеличивать набор данных, дублируя строки и столбцы, но я достиг предела памяти вместо того, чтобы заставить svm
работать усерднее...