Я имею каталог с> 1 000 .html файлов и хотел бы проверить всех их на неработающие каналы - предпочтительно использование консоли. Какой-либо инструмент можно ли рекомендовать для такой задачи?
Вы можете извлекать ссылки из файлов HTML с помощью текстового браузера Lynx . Создание сценариев Bash вокруг этого не должно вызывать затруднений.
вы можете использовать wget
, например,
wget -r --spider -o output.log http://somedomain.com
внизу файла output.log, он укажет, wget
обнаружил неработающие ссылки. вы можете разобрать это с помощью awk / grep
Попробуйте использовать инструменты командной строки webgrep или, если вам удобен Perl, модуль HTML::TagReader того же автора.