Используйте Urllib2 в сочетании с Brilliant BasineSoup Библиотека:
import urllib2
from BeautifulSoup import BeautifulSoup
# or if you're using BeautifulSoup4:
# from bs4 import BeautifulSoup
soup = BeautifulSoup(urllib2.urlopen('http://example.com').read())
for row in soup('table', {'class': 'spad'})[0].tbody('tr'):
tds = row('td')
print tds[0].string, tds[1].string
# will print date and sunrise
Вы можете использовать Urllib2 , чтобы сделать HTTP-запросы, а затем у вас будет веб-контент.
Вы можете получить это так:
import urllib2
response = urllib2.urlopen('http://example.com')
html = response.read()
Красивый суп - это анализатор HTML Python, который должен быть хорошим для соскоба экрана.
В частности, здесь - их учебное пособие по анализу HTML-документа.
Удачи!