Извлечь текст после < hr > тег в BeautifulSoup

Для тех из вас, кто работает в среде Windows, этот пакетный скрипт работает для меня.

Он ждет, пока работает демон ADB, затем начнет опрос свойства sys.boot_completed и ждет значения 1.

Это не так элегантно, как одна строка, но у меня есть сценарий, указанный в моей переменной среды PATH, поэтому его можно вызвать напрямую.

adb wait-for-device

:CheckAgain
set value=
for /f "delims=" %%a in ('adb shell getprop sys.boot_completed') do @set value=%%a

IF NOT "%value%" == "1" (
    timeout /t 2 /nobreak >NUL
    goto CheckAgain
)
0
задан Owais Arshad 11 March 2019 в 13:59
поделиться

1 ответ

Это немного сложно и выглядит как обходной путь, но вы можете использовать атрибут next_sibling элемента bs4 и проверить type. Но это работает:

from urllib.request import urlopen
import bs4
import requests
import json
from selenium import webdriver

html = """<div itemprop="articleBody" class="article-body">
            <p itemprop="immediateRelease" class="immediateRelease">IMMEDIATE RELEASE</p>
            <h1 itemprop="headline">HEADLINE</h1>
            <div class="hidden-lg meta">
                <ul>
                    <li><time pubdate="" datetime="Jan. 23, 2019">Jan. 23, 2019</time></li>
                    <li>News Release</li>

                    <li>Release No: NR-014-19</li>

                </ul>
            </div>

                <hr>

Text Text Text <br>
<br>
Text Text Text <br>
<br>
Text Text Text.<br>
<br>
Text Text Text  <a href="mailto: Text Text Text " class="ApplyClass"> Text Text Text </a>.<br>
<p>&nbsp;</p>
<p>E Text Text Text </p>

            </div>"""

soup = bs4.BeautifulSoup(html,'html.parser')
div = soup.find('div')
text =  ''
el = div.find('hr')
while(el):
    el = el.next_sibling
    if isinstance(el, bs4.element.Tag):
        text += el.get_text()
    elif isinstance(el, bs4.element.NavigableString):
        text += el

print(text)

ВЫХОД:

Text Text Text 

Text Text Text 

Text Text Text.

Text Text Text   Text Text Text .
 
E Text Text Text 
0
ответ дан Maaz 11 March 2019 в 13:59
поделиться
Другие вопросы по тегам:

Похожие вопросы: