У кого-либо есть хорошее решение для очистки источника HTML страницы с содержанием (в этом случае, HTML-таблицы) сгенерированный с JavaScript? [закрытый]

5
задан Brian Tompsett - 汤莱恩 29 November 2016 в 22:55
поделиться

2 ответа

Это более надежная версия примера в OP с использованием cURL / Crowbar:

<?php
function get_html($url)
{
$curl = curl_init();
curl_setopt ($curl, CURLOPT_URL, 'http://127.0.0.1:10000/?url=' . $url . '&delay=3000&view=as-is');
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
$html = curl_exec ($curl);
return $html;
}
?>

Получал частые "не удалось открыть поток: HTTP-запрос не выполнен!" ошибки при использовании f_g_c с несколькими URL-адресами.

Также не забудьте указать URL-адрес $ url (например, 'http% 3A% 2F% 2Fwww.google.com'> ' http://www.google.com ').

2
ответ дан 15 December 2019 в 00:52
поделиться

Что ж, Java предоставляет некоторые удобные решения, такие как HtmlUint , который правильно интерпретирует Javascript и, как следствие, должен позволять сгенерированный HTML-код быть видимым.

2
ответ дан 15 December 2019 в 00:52
поделиться
Другие вопросы по тегам:

Похожие вопросы: