Недавно Эдвин Чен опубликовал отличную карту регионального использования газировки, газировки и колы, созданную на основе геокодированных твитов, в которых эти слова упоминаются в контексте употребления алкоголя.http://blog.echen.me/2012/07/06/soda-vs-pop-with-twitter/
Он упоминает, что использовал пакет twitteR, созданный Джеффом Джентри в R. Конечно же, легко собрать твиты, в которых используется заданное слово, и поместить их в фрейм данных :
require(twitteR)
require(plyr)
cat.tweets<-searchTwitter("cats",n=1000)
tweets.df = ldply(cat.tweets, function(t) t$toDataFrame() )
. кадр данных (tweets.df )будет содержать идентификатор пользователя, текст твита и т. д. для каждого твита, но, похоже, не содержит геокод. Любая идея о том, как получить его в R?