Используйте BeautifulSoup для извлечения текста перед первым дочерним тегом

Question

Используйте BeautifulSoup для извлечения текста перед первым дочерним тегом

Из этого источника html:

<div class="category_link">
  Category:
  <a href="/category/personal">Personal</a>
</div>

Я хочу извлечь текст Категория:

Вот мои попытки с использованием Python /BeautifulSoup (с выводом в виде комментария - после #)

parsed = BeautifulSoup(sample_html)
parsed_div = parsed.findAll('div')[0]
parsed_div.firstText() # <a href="/category/personal">Personal</a>
parsed_div.first() # <a href="/category/personal">Personal</a>
parsed_div.findAll()[0] # <a href="/category/personal">Personal</a>

Я ожидаю, что "текстовый узел" будет доступен в качестве первого потомка. Любые предложения о том, как я могу решить эту проблему?

6

beautifulsoup python

задан Elvis D'Souza 14 April 2012 в 14:08

0 ответов

Другие вопросы по тегам:

beautifulsoup python

Используйте BeautifulSoup для извлечения текста перед первым дочерним тегом

0 ответов

Похожие вопросы: