Как очистить защищенные страницы в R (ссылки https) (используя readHTMLTable из пакета XML)?

Question

Как очистить защищенные страницы в R (ссылки https) (используя readHTMLTable из пакета XML)?

На SO есть хорошие ответы о том, как использовать readHTMLTable из пакета XML, и я сделал это с обычными http-страницами, однако я не могу решить свою проблему с https-страницами.

Я пытаюсь прочитать таблицу на этом веб-сайте (строка URL):

library(RTidyHTML)
library(XML)
url <- "https://ned.nih.gov/search/ViewDetails.aspx?NIHID=0010121048"
h = htmlParse(url)
tables <- readHTMLTable(url)

Но я получаю эту ошибку: Файл https://ned.nih.gov/search/Vi...doesне существует.

Я попытался решить проблему https с помощью этого (первые 2 строки ниже) (используя Google для поиска решения (например, здесь: http://tonybreyal.wordpress.com/2012/01/13/ra). -quick-scrape-of-top-grossing-films-from-boxofficemojo-com/).

Этот трюк помогает увидеть больше страницы, но любые попытки извлечь таблицу не работают. Любой совет Мне нужны поля таблицы, такие как Организация, Название организации, Менеджер.

 #attempt to get past the https problem 
 raw <- getURL(url, followlocation = TRUE, cainfo = system.file("CurlSSL", "cacert.pem", package = "RCurl"))
 head(raw)
[1] "\r\n\n\n\n


         
            18

         
         
            r web-scraping xml         
         
         
            задан Charles            2 June 2012 в 18:26 
         
         
         поделиться


  

      
    

    
   
   
      0 ответов
      

      
         
                     
      

            
          Другие вопросы по тегам:          
         r web-scraping xml       
        Похожие вопросы:

        
          
                          39 
 Действительно ли XSLT стоит того? [закрытый] - 14 March 2011 17:13 
                            30 
 Каков самый полезный прием R? [закрытый] - 25 September 2017 20:52 
                            30 
 Пишите Довольно XML-содержимое в файле с использованием Java [duplicate]  - 5 July 2013 17:04 
                            30 
 PHP struct для создания XML из массива?  [Дубликат]  - 13 August 2011 17:01 
                            29 
 Варианты соскоба HTML? [закрыто] - 31 August 2018 22:28 
                            26 
 Как удалить номера из имен?  [Дубликат]  - 25 October 2017 10:59 
                            25 
 Эквивалент команды Setdiff R в Python [дубликат]  - 29 April 2017 13:12