Как wget может сохранять только определенные типы файлов, на которые есть ссылки со страниц, на которые ссылается целевая страница?

Как wget может сохранять только определенные типы файлов, на которые есть ссылки со страниц, на которые ссылается целевая страница, независимо от домена, в котором находятся определенные файлы?

Пытаясь ускорить задачу, я должен делаю часто.

Я рутировал через wget docs и искал в Google, но ничего не работает. Я продолжаю получать либо только целевую страницу, либо подстраницы без файлов (даже используя -H), так что у меня явно плохо получается.

Так что, по сути, example.com/index1/ содержит ссылки на example. com / subpage1 / и example.com/subpage2/, а подстраницы содержат ссылки на example2.com/file.ext и example2.com/file2.ext и т. д. Однако example.com/index1.html может ссылаться на example. com / index2 /, в котором есть ссылки на другие подстраницы, которые мне не нужны.

Может ли wget даже это сделать, а если нет, то что вы предлагаете мне использовать? Спасибо.

14
задан Nomen 10 July 2011 в 20:32
поделиться