Построение тематической модели LDA по годам

Кроме того, я нашел хорошее решение для использования режима jQuery noConflict.

(function($){

  $(document).ready(function(){
      // write code here
  });

  // or also you can write jquery code like this

  jQuery(document).ready(function(){
      // write code here
  });

})(jQuery);

Я нашел это решение здесь. https://thecodingstuff.com/how-to-properly-use-jquery-noconflict-mode-in-wordpress/

0
задан Ana 3 March 2019 в 12:00
поделиться

1 ответ

Проблема в том, что ui = unique(dtm$i) удаляет несколько документов (я не знаю, почему вы это делаете, поэтому я не буду комментировать эту часть). Таким образом, ваша тета не имеет того же количества строк, что и данные. Мы можем решить эту проблему, сохранив только те строки, которые все еще находятся в тэте:

library("dplyr")
library("reshape2")
library("ggplot2")
tweets_clean <- tweets %>% 
  mutate(id = rownames(.)) %>% 
  filter(id %in% rownames(theta)) %>% # keep only rows still in theta
  cbind(theta) %>% # now we can attach the topics to the data.frame
  mutate(year = format(date, "%Y")) # make year variable

Затем я использовал функции dplyr для агрегации, поскольку я думаю, что это облегчает чтение кода:

tweets_clean_yearly <- tweets_clean %>% 
  group_by(year) %>% 
  summarise_at(vars(as.character(1:7)), funs(mean)) %>% 
  melt(id.vars = "year")

Тогда мы можем построить это:

ggplot(tweets_clean_yearly, aes(x = year, y = value, fill = variable)) + 
  geom_bar(stat = "identity") + 
  ylab("proportion")

plot

Примечание : Я проверял, если Тета и твиты были действительно с такими же документами:

tweets_clean <- tweets %>% 
  mutate(id = rownames(.)) %>% 
  filter(id %in% rownames(theta))

all.equal(tweets_clean$id, rownames(theta))
0
ответ дан JBGruber 3 March 2019 в 12:00
поделиться
Другие вопросы по тегам:

Похожие вопросы: