Я пытаюсь получить источник веб-страницы, включая любые изображения. На данный момент у меня есть это:
import urllib
page = urllib.urlretrieve('http://127.0.0.1/myurl.php', 'urlgot.php')
print urlgot.php
, который извлекает источник штрафа, но мне также нужно загружать любые связанные изображения.
Я думал, что смогу создать регулярное выражение, которое искал IMG SRC или аналогичный в загруженном источнике; Тем не менее, мне было интересно, была ли функция Urllib, которая также извлекает изображения? Подобно команде wget of:
wget -r --no-parent http://127.0.0.1/myurl.php
Я не хочу использовать модуль ОС и запустить WGET, так как я хочу, чтобы скрипт запустился по всем системам. По этой причине я не могу использовать какие-либо сторонние модули.
Любая помощь очень ценится! Спасибо