1
ответ

R tm - как получить разреженность TermDocumentMatrix как переменной? [Дубликат]

У меня есть несколько больших TermDocumentMatrices, которые я обрезаю до более управляемого размера, используя функцию removeSparseTerms (). Один из аргументов, которые я должен отправить, конечно, разрежен. ...
вопрос задан: 7 October 2015 18:25
0
ответов

Более эффективные средства для создания корпуса и DTM с 4M строк

В моем файле более 4 миллионов строк, и мне нужен более эффективный способ преобразования моих данных в матрицу терминов корпуса и документа, чтобы я мог передать их в байесовский классификатор. Рассмотрим следующий код: ...
вопрос задан: 15 July 2016 02:23
0
ответов

Пакет R tm создает матрицу из N наиболее часто встречающихся терминов

У меня есть termDocumentMatrix, созданный с использованием пакета tm в R. Я пытаюсь создать матрицу/фрейм данных, в которой есть 50 наиболее часто встречающихся терминов. Когда я пытаюсь преобразовать в матрицу, я получаю это...
вопрос задан: 16 July 2012 16:42