Что использовать, чтобы проверить, что HTML связывается в крупном проекте на Linux?

Я имею каталог с> 1 000 .html файлов и хотел бы проверить всех их на неработающие каналы - предпочтительно использование консоли. Какой-либо инструмент можно ли рекомендовать для такой задачи?

5
задан Hubert Kario 6 February 2012 в 00:46
поделиться

4 ответа

Вы можете извлекать ссылки из файлов HTML с помощью текстового браузера Lynx . Создание сценариев Bash вокруг этого не должно вызывать затруднений.

0
ответ дан 14 December 2019 в 13:33
поделиться

вы можете использовать wget , например,

wget -r --spider  -o output.log http://somedomain.com

внизу файла output.log, он укажет, wget обнаружил неработающие ссылки. вы можете разобрать это с помощью awk / grep

4
ответ дан 14 December 2019 в 13:33
поделиться

Попробуйте использовать инструменты командной строки webgrep или, если вам удобен Perl, модуль HTML::TagReader того же автора.

0
ответ дан 14 December 2019 в 13:33
поделиться

Я бы использовал checklink (проект W3C)

2
ответ дан 14 December 2019 в 13:33
поделиться
Другие вопросы по тегам:

Похожие вопросы: