Веб-выскабливание [закрытым] Python

179
задан ST4 15 April 2014 в 09:24
поделиться

2 ответа

Используйте Urllib2 в сочетании с Brilliant BasineSoup Библиотека:

import urllib2
from BeautifulSoup import BeautifulSoup
# or if you're using BeautifulSoup4:
# from bs4 import BeautifulSoup

soup = BeautifulSoup(urllib2.urlopen('http://example.com').read())

for row in soup('table', {'class': 'spad'})[0].tbody('tr'):
    tds = row('td')
    print tds[0].string, tds[1].string
    # will print date and sunrise
186
ответ дан 23 November 2019 в 20:12
поделиться

Вы можете использовать Urllib2 , чтобы сделать HTTP-запросы, а затем у вас будет веб-контент.

Вы можете получить это так:

import urllib2
response = urllib2.urlopen('http://example.com')
html = response.read()

Красивый суп - это анализатор HTML Python, который должен быть хорошим для соскоба экрана.

В частности, здесь - их учебное пособие по анализу HTML-документа.

Удачи!

7
ответ дан 23 November 2019 в 20:12
поделиться
Другие вопросы по тегам:

Похожие вопросы: