Эквивалент wget в Python для загрузки веб-сайта и ресурсов

То же самое, о чем спрашивали 2,5 года назад в Загрузка веб-страницы и всех ее файлов ресурсов в Python , но не приводит к ответу и «см. Соответствующую тему» ​​не является На самом деле я спрашиваю об одном и том же.

Я хочу скачать все на странице, чтобы можно было просматривать это только из файлов.

Команда

wget --page-Requisites --domains = ДОМЕН --no-parent --html-extension --convert-links --restrict-file-names = windows

делает именно то, что я необходимость. Однако мы хотим иметь возможность связать его с другими вещами, которые должны быть переносимыми, поэтому требуется, чтобы он был на Python.

Я смотрел Beautiful Soup, scrapy, различных пауков, размещенных повсюду, но все они, похоже, имеют дело с получением данных / ссылок умными, но конкретными способами. Использование их для выполнения того, что я хочу, похоже, потребует много работы, чтобы найти все ресурсы, хотя я уверен, что должен быть простой способ.

большое спасибо

6
задан Community 23 May 2017 в 11:44
поделиться