Свести JSON в одну строку, используя Pandas и json_normalize

Я встретил это решение из пакета «gofastR» в R:

dtm2 <- remove_stopwords(dtm, stopwords = stopwords)

Однако я все еще видел стоп-фразы в результатах. После просмотра документации remove_stopwords предполагает, что у нее есть отсортированный список - вы можете подготовить свои стоп-слова / фразы, используя функцию prep_stopwords () из одного и того же пакета.

stopwords<-prep_stopwords(stopwords)
dtm2 <- remove_stopwords(dtm, stopwords = stopwords)

Чтобы сделать это и закончите. Мы можем выполнить вывод в части tm_map кода и удалить следующие шаги:

stopwords<-prep_stopwords(stemDocument(stopwords))
dtm2 <- remove_stopwords(dtm, stopwords = stopwords)

, так как это приведет к остановке слов, которые будут соответствовать уже сжатым словам в dtm.

0
задан K.Pil 18 January 2019 в 21:59
поделиться