Я пытаюсь получить доступ к странице Википедии, чтобы получить список страниц, и получаю следующую ошибку:
library(RCurl)
u <- "http://en.wikipedia.org/w/index.php?title=Special%3APrefixIndex&prefix=tal&namespace=4"
getURL(u)
[1] "Scripts should use an informative User-Agent string with contact information, or they may be IP-blocked without notice.\n"
Я надеюсь получить доступ к этой странице через Wikipedia api, но я не уверен, что это сработает.
И дело в том, что другие страницы читаются без проблем, например:
u <- "http://en.wikipedia.org/wiki/Wikipedia:Talk"
getURL(u)
Есть предложения?
Side note: В общем, я бы предпочел не скрести вики-страницы и идти через api, но я боюсь, что эти конкретные страницы еще не доступны через api...