Ошибка пакета TM "не может преобразовать документацию documenttermmatrix в нормальную матрицу, поскольку Vector слишком большой«

Я создал DocumentterMMatrix, содержащую 1859 документов (строки) и 25722 (столбцы). Чтобы выполнить дальнейшие расчеты на этой матрице, мне нужно преобразовать его в обычную матрицу. Я хочу использовать команду as.matrix () . Однако он возвращает следующую ошибку: не удается выделить вектор размером 364,8 МБ.

> corp
A corpus with 1859 text documents
> mat<-DocumentTermMatrix(corp)
> dim(mat)
[1]  1859 25722
> is(mat)
[1] "DocumentTermMatrix"
> mat2<-as.matrix(mat)
Fehler: kann Vektor der Größe 364.8 MB nicht allozieren # cannot allocate vector of size 364.8 MB
> object.size(mat)
5502000 bytes

По какой-то причине размер объекта, кажется, резко увеличивается всякий раз, когда он преобразуется в обычную матрицу. Как я могу избежать этого?

Или есть ли альтернативный способ выполнения обычных матричных операций на документетерМатрикс?

5
задан Pop 11 September 2012 в 08:15
поделиться