Анализировать веб-сайт на предмет URL-адресов

Просто интересно, может ли кто-нибудь мне помочь далее со следующим. Я хочу разобрать URL-адрес на этом веб-сайте: http: //www.directorycritic.com/free-directory-list. html? pg = 1 & sort = pr

У меня есть следующий код:

<?PHP  
$url = "http://www.directorycritic.com/free-directory-list.html?pg=1&sort=pr";
$input = @file_get_contents($url) or die("Could not access file: $url"); 
$regexp = "<a\s[^>]*href=(\"??)([^\" >]*?)\\1[^>]*>(.*)<\/a>"; 
if(preg_match_all("/$regexp/siU", $input, $matches)) { 
// $matches[2] = array of link addresses 
// $matches[3] = array of link text - including HTML code
} 
?>

Что в настоящее время ничего не делает, и что мне нужно сделать, так это удалить все URL-адреса в таблице для всех 16 страниц, и я был бы очень признателен за некоторую помощь с как изменить приведенное выше, чтобы сделать это и вывести URL-адрес в текстовый файл.

5
задан Naveed 16 December 2010 в 13:42
поделиться