У меня есть несколько больших TermDocumentMatrices, которые я обрезаю до более управляемого размера, используя функцию removeSparseTerms (). Один из аргументов, которые я должен отправить, конечно, разрежен. ...
В моем файле более 4 миллионов строк, и мне нужен более эффективный способ преобразования моих данных в матрицу терминов корпуса и документа, чтобы я мог передать их в байесовский классификатор. Рассмотрим следующий код: ...
У меня есть termDocumentMatrix, созданный с использованием пакета tm в R. Я пытаюсь создать матрицу/фрейм данных, в которой есть 50 наиболее часто встречающихся терминов. Когда я пытаюсь преобразовать в матрицу, я получаю это...