Как wget может сохранять только определенные типы файлов, на которые есть ссылки со страниц, на которые ссылается целевая страница, независимо от домена, в котором находятся определенные файлы?
Пытаясь ускорить задачу, я должен делаю часто.
Я рутировал через wget docs и искал в Google, но ничего не работает. Я продолжаю получать либо только целевую страницу, либо подстраницы без файлов (даже используя -H), так что у меня явно плохо получается.
Так что, по сути, example.com/index1/ содержит ссылки на example. com / subpage1 / и example.com/subpage2/, а подстраницы содержат ссылки на example2.com/file.ext и example2.com/file2.ext и т. д. Однако example.com/index1.html может ссылаться на example. com / index2 /, в котором есть ссылки на другие подстраницы, которые мне не нужны.
Может ли wget даже это сделать, а если нет, то что вы предлагаете мне использовать? Спасибо.