Я отказываюсь от газеты, чтобы получить тело уведомлений, p> Я беру все теги «& lt; p>», но мне нужно исключить тег «& lt; p> & lt; div class =" L video ">, потому что ...
Я хочу проанализировать «https://meshb.nlm.nih.gov/treeView» с помощью BeautifulSoup, но выполнение приведенного ниже кода дает мне пустой список [] import json, запросы из bs4 import BeautifulSoup url = ('https: // meshb ....
Мое регулярное выражение python, использующее re, возвращает список кортежей, где я ожидаю только простой список. Я очищаю более 100 веб-страниц, используя красивый суп, чтобы получить информацию о версии программного обеспечения, которая возвращается ..
У меня есть веб-сайт, который я очищаю, который имеет подобную структуру следующее. Я хотел бы смочь захватить информацию из блока CData. Я использую BeautifulSoup для получения по запросу другой информации от страницы...
Запуск с ввода HTML как это: <p> <href = "http://www.foo.com"> это, если нечто </a> <href = "http://www.bar.com"> это, если панель </a> </p> использование BeautifulSoup, меня...
Кажется, что существует много путаницы в отношении этого метода из прекрасного супа 4 или bs4. Как вы можете видеть в моей ссылке здесь, в Reddit, есть разница в мнениях, в которых можно использовать. Я был ...
Я пытаюсь удалить теги комментариев из локальных XML-файлов, используя библиотеку BeautifulSoup. образец XML & lt;? xml version = "1.0" encoding = "UTF-8"? & gt; & Lt; примечание & GT; & lt;! - удалить это - & gt; & ...
Я играл с BeautifulSoup, и это здорово. Моя конечная цель - попытаться получить текст со страницы. Я просто пытаюсь получить текст из тела, с особым случаем, чтобы получить заголовок ...
импортируйте импорт urllib2 urllib из BeautifulSoup # html импорта BeautifulSoup от импорта XML импорта BeautifulSoup BeautifulSoup BeautifulStoneSoup # #, все импортирует ре f =...
Я использую Python и beautifulsoup (в новинку для обоих!), и я хочу войти в веб-сайт поставщиков. Таким образом, их форма похожа (упрощенный): <формируют name=loginform метод action=/index.html = "сообщение"> и...
BeautifulSoup анализирует HTML и предлагает различные способы управлять и искать в HTML. Действительно ли там что-то подобно для CSS? А именно, я хотел бы знать, представляется ли данный текст HTML как полужирный...
У меня есть этот код, который выбирает некоторый текст от использования страницы суп BeautifulSoup = BeautifulSoup (HTML) тело = soup.find ('отделение', {'идентификатор':'body'}) орган по печати, я хотел бы сделать это как допускающую повторное использова
Я использовал BeautifulSoup для обработки XML-файлов, которые я собрал через API REST. Ответы содержат HTML-код, но BeautifulSoup выходит из всех HTML-тэгов, таким образом, он может быть отображен приятно...
Я хочу использовать BeautfulSoup, чтобы искать и заменить <\a> <\a> <br>. Я знаю, как открыться urllib2 и затем проанализировать для извлечения весь <a> теги. То, что я хочу сделать, искать и...
Я использую этот код для нахождения всех интересных ссылок на странице: soup.findAll (href=re.compile ('^notizia.php \? idn =\d + ')), И это делает свое задание вполне прилично. К сожалению, в этом тег там...
Я пытаюсь использовать BeautifulSoup, чтобы проанализировать через дерево DOM и извлечь имена авторов. Ниже отрывок HTML для показа структуры кода, который я собираюсь очистить. <HTML> <...
если страница будет иметь <класс отделения = "class1"> и <p класс = "class1">, то soup.findAll (Правда, 'class1') найдет их обоих. Если это будет иметь <p класс = "class1 class2">, тем не менее, то это не бу
Я борюсь с синтаксисом, требуемым захватить некоторый hrefs в td. Таблица, TR и td элементы не имеют никакого класса или идентификатора. Если бы я хотел захватить привязку в этом примере, в чем я нуждался бы? И...
Я хотел бы сделать очень простую замену с помощью Красивого Супа. Скажем, я хочу посетить все теги на странице и добавить"? нечто" к их href. Может кто-то отправлять или связываться с примером того, как сделать...
Я должен быть в состоянии изменить каждую ссылку в документе HTML. Я знаю, что должен использовать SoupStrainer, но я не на 100% положителен относительно того, как реализовать его. Если кто-то мог бы направить меня к пользе...
Я могу использовать Python lxml на Google App Engine? (или я должен использовать Красивый Суп?) Я начал использовать Красивый Суп, но это кажется медленным. Я только начинаю играть с идеей "анализа экранных данных"...
I'm having trouble parsing HTML elements with "class" attribute using Beautifulsoup. The code looks like this soup = BeautifulSoup(sdata)
mydivs = soup.findAll ('div')
for div in mydivs: if (div["...
Я анализирую текст HTML / xml и удаляю из него набор тегов, таких как fs, img, используя BeautifulSoup. Документ, который я анализирую, имеет тег < тег ... > вместо тега < tag .... / > Итак, я хотел ...
Я пытаюсь получить информацию о ссылке, используя мыло в Python. Я могу получить весь массив с информацией, но я не знаю, как манипулировать информацией так, как я хочу. Например:...
Я скачал несколько HTML-файлов, которые хочу проанализировать. Мне удалось разобрать файлы, но теперь я хочу составить несколько списков, чтобы я мог составить точечный график. Я совершенно новичок в Python, поэтому я не уверен, как ...