BeautifulSoup - изменение всех ссылок в части HTML?

Я знаю, что этому ответили до смерти, но я хотел бы показать фактический пример различий в скорости.

Здесь мы создаем 2 000 000 новых объектов с помощью метода print в Chrome. Мы сохраняем каждый объект в массиве. Помещение print на прототип занимает около 1/2.

18
задан Evan Fosmark 20 January 2009 в 02:52
поделиться

2 ответа

Возможно, что-то вроде этого работало бы? (У меня нет интерпретатора Python передо мной, к сожалению)

from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup('<p>Blah blah blah <a href="http://google.com">Google</a></p>')
for a in soup.findAll('a'):
  a['href'] = a['href'].replace("google", "mysite")

result = str(soup)
39
ответ дан 30 November 2019 в 05:46
поделиться
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup('<p>Blah blah blah <a href="http://google.com">Google</a></p>')
for a in soup.findAll('a'):
    a['href'] = a['href'].replace("google", "mysite")
print str(soup)

Это - решение Lusid, но так как у него не было интерпретатора Python перед ним, он не смог протестировать его, и оно имело несколько ошибок. Я просто хотел отправить рабочее состояние. Lusid благодарности!

29
ответ дан 30 November 2019 в 05:46
поделиться
Другие вопросы по тегам:

Похожие вопросы: