Я пытаюсь быть немного хитрым и в рамках учебного процесса пытаюсь улучшить парсинг страниц. навыки и умения.
Одна вещь, с которой я столкнулся и которую мне еще предстоит решить, заключается в том, что некоторые сайты будут использовать внутреннюю ссылку, которая затем перенаправляет на внешнюю ссылку.
Что я хочу сделать, так это изменить код curl, чтобы он следовал за перенаправлениями до тех пор, пока они не остановятся, а затем получил URL-адрес конечного места отдыха.
Кто-нибудь порекомендует мне код?
У меня есть это в данный момент,но в данный момент он не следует перенаправлениям должным образом.
$opts = array(CURLOPT_URL => $url,
CURLOPT_RETURNTRANSFER => true,
CURLOPT_HEADER => true,
CURLOPT_FOLLOWLOCATION => true);
$curl = curl_init();
curl_setopt_array($curl, $opts);
$str = curl_exec($curl);
curl_close($curl);