Веб-выскабливание [закрытым] Python

Question

Веб-выскабливание [закрытым] Python

179

задан ST4 15 April 2014 в 09:24

2 ответа

Вы можете использовать Urllib2 , чтобы сделать HTTP-запросы, а затем у вас будет веб-контент.

Вы можете получить это так:

import urllib2
response = urllib2.urlopen('http://example.com')
html = response.read()

Красивый суп - это анализатор HTML Python, который должен быть хорошим для соскоба экрана.

В частности, здесь - их учебное пособие по анализу HTML-документа.

Удачи!

7

ответ дан 23 November 2019 в 20:12

Другие вопросы по тегам:

python screen-scraping

Похожие вопросы:

score 186 · Accepted Answer

Используйте Urllib2 в сочетании с Brilliant BasineSoup Библиотека:

import urllib2
from BeautifulSoup import BeautifulSoup
# or if you're using BeautifulSoup4:
# from bs4 import BeautifulSoup

soup = BeautifulSoup(urllib2.urlopen('http://example.com').read())

for row in soup('table', {'class': 'spad'})[0].tbody('tr'):
    tds = row('td')
    print tds[0].string, tds[1].string
    # will print date and sunrise