2
ответа

Красивый суп findall с исключением groupon [duplicate]

Я отказываюсь от газеты, чтобы получить тело уведомлений, p> Я беру все теги «& lt; p>», но мне нужно исключить тег «& lt; p> & lt; div class =" L video ">, потому что ...
вопрос задан: 28 February 2017 14:54
2
ответа

BeautifulSoup не может разобрать веб-сайт [дубликат]

Я хочу проанализировать «https://meshb.nlm.nih.gov/treeView» с помощью BeautifulSoup, но выполнение приведенного ниже кода дает мне пустой список [] import json, запросы из bs4 import BeautifulSoup url = ('https: // meshb ....
вопрос задан: 27 February 2017 01:21
2
ответа

извлечение переменных массива javascript с использованием regex возвращает список кортежей [duplicate]

Мое регулярное выражение python, использующее re, возвращает список кортежей, где я ожидаю только простой список. Я очищаю более 100 веб-страниц, используя красивый суп, чтобы получить информацию о версии программного обеспечения, которая возвращается ..
вопрос задан: 10 August 2015 16:01
2
ответа

Механизировать и BeautifulSoup для PHP? [закрытый]

Я задавался вопросом, было ли что-либо подобное как, Механизируют или BeautifulSoup для PHP?
вопрос задан: 3 November 2013 17:00
2
ответа

Как я могу захватить CData из BeautifulSoup

У меня есть веб-сайт, который я очищаю, который имеет подобную структуру следующее. Я хотел бы смочь захватить информацию из блока CData. Я использую BeautifulSoup для получения по запросу другой информации от страницы...
вопрос задан: 13 May 2013 08:24
2
ответа

Как добавить тег после ссылки с BeautifulSoup

Запуск с ввода HTML как это: <p> <href = "http://www.foo.com"> это, если нечто </a> <href = "http://www.bar.com"> это, если панель </a> </p> использование BeautifulSoup, меня...
вопрос задан: 17 September 2012 20:05
2
ответа

Python красивый суп: это soup.findAll, или soup.find_all? [Дубликат]

Кажется, что существует много путаницы в отношении этого метода из прекрасного супа 4 или bs4. Как вы можете видеть в моей ссылке здесь, в Reddit, есть разница в мнениях, в которых можно использовать. Я был ...
вопрос задан: 9 September 2012 14:08
2
ответа

Ошибка py2exe в exe-файле для Windows 7 [дубликат]

Я пытаюсь сделать exe-файл с -py2exe Вот мой код: импортные запросы из bs4 import BeautifulSoup import csv def get_html (url): r = запросы.get (url) return r.text url = 'http: //. ..
вопрос задан: 15 March 2011 10:13
2
ответа

BeautifulSoup, как правильно использовать функцию разложения () [duplicate]

Я пытаюсь удалить теги комментариев из локальных XML-файлов, используя библиотеку BeautifulSoup. образец XML & lt;? xml version = "1.0" encoding = "UTF-8"? & gt; & Lt; примечание & GT; & lt;! - удалить это - & gt; & ...
вопрос задан: 17 August 2010 23:43
2
ответа

Как я могу удалить теги комментариев из HTML, используя BeautifulSoup?

Я играл с BeautifulSoup, и это здорово. Моя конечная цель - попытаться получить текст со страницы. Я просто пытаюсь получить текст из тела, с особым случаем, чтобы получить заголовок ...
вопрос задан: 17 August 2010 22:43
2
ответа

BeautifulSoup (HTML), не работающий, говорящий, не может назвать модуль?

импортируйте импорт urllib2 urllib из BeautifulSoup # html импорта BeautifulSoup от импорта XML импорта BeautifulSoup BeautifulSoup BeautifulStoneSoup # #, все импортирует ре f =...
вопрос задан: 30 July 2010 01:50
2
ответа

отправьте на страницу для входа в систему в использующий красивый суп

Я использую Python и beautifulsoup (в новинку для обоих!), и я хочу войти в веб-сайт поставщиков. Таким образом, их форма похожа (упрощенный): <формируют name=loginform метод action=/index.html = "сообщение"> и...
вопрос задан: 27 July 2010 01:36
2
ответа

BeautifulSoup, но для CSS?

BeautifulSoup анализирует HTML и предлагает различные способы управлять и искать в HTML. Действительно ли там что-то подобно для CSS? А именно, я хотел бы знать, представляется ли данный текст HTML как полужирный...
вопрос задан: 26 April 2010 19:18
2
ответа

beautifulsoup: найдите одноуровневый элемент энного элемента

У меня есть сложный HTML дерево DOM следующей природы: <таблица>... <TR> <td>... </td> <td> <таблица>...
вопрос задан: 10 April 2010 13:25
2
ответа

Python красивые аргументы супа

У меня есть этот код, который выбирает некоторый текст от использования страницы суп BeautifulSoup = BeautifulSoup (HTML) тело = soup.find ('отделение', {'идентификатор':'body'}) орган по печати, я хотел бы сделать это как допускающую повторное использова
вопрос задан: 3 April 2010 12:28
2
ответа

От завершенного HTML-> к регулярному HTML? - Python

Я использовал BeautifulSoup для обработки XML-файлов, которые я собрал через API REST. Ответы содержат HTML-код, но BeautifulSoup выходит из всех HTML-тэгов, таким образом, он может быть отображен приятно...
вопрос задан: 19 March 2010 04:25
2
ответа

Поиск и замена в HTML с BeautifulSoup

Я хочу использовать BeautfulSoup, чтобы искать и заменить <\a> <\a> <br>. Я знаю, как открыться urllib2 и затем проанализировать для извлечения весь <a> теги. То, что я хочу сделать, искать и...
вопрос задан: 15 January 2010 17:55
2
ответа

BeautifulSoup - простой способ к получить содержание без HTML

Я использую этот код для нахождения всех интересных ссылок на странице: soup.findAll (href=re.compile ('^notizia.php \? idn =\d + ')), И это делает свое задание вполне прилично. К сожалению, в этом тег там...
вопрос задан: 28 December 2009 16:02
2
ответа

Парсинг использования данных BeautifulSoup в Python

Я пытаюсь использовать BeautifulSoup, чтобы проанализировать через дерево DOM и извлечь имена авторов. Ниже отрывок HTML для показа структуры кода, который я собираюсь очистить. <HTML> <...
вопрос задан: 1 October 2009 03:23
2
ответа

Красивый Суп не может найти класс CSS, если объект имеет другие классы, также

если страница будет иметь <класс отделения = "class1"> и <p класс = "class1">, то soup.findAll (Правда, 'class1') найдет их обоих. Если это будет иметь <p класс = "class1 class2">, тем не менее, то это не бу
вопрос задан: 7 August 2009 03:34
2
ответа

Как выбрать содержимое тега span span в python [duplicate]

& lt; span class = "labels" & gt; & lt; a href = "/ misp / securehomegateway-router / issues? q = is% 3Aopen + is% 3Apr + label% 3AHCL" class = "label v-align-text-top labelstyle-006b75 linked-labelstyle-006b75". ..
вопрос задан: 29 June 2009 15:27
2
ответа

Как получить вложенный элемент в красивом супе

Я борюсь с синтаксисом, требуемым захватить некоторый hrefs в td. Таблица, TR и td элементы не имеют никакого класса или идентификатора. Если бы я хотел захватить привязку в этом примере, в чем я нуждался бы? И...
вопрос задан: 29 June 2009 14:27
2
ответа

Где я могу найти некоторых “привет миром” - простые Красивые примеры Супа?

Я хотел бы сделать очень простую замену с помощью Красивого Супа. Скажем, я хочу посетить все теги на странице и добавить"? нечто" к их href. Может кто-то отправлять или связываться с примером того, как сделать...
вопрос задан: 4 May 2009 17:53
2
ответа

BeautifulSoup дает мне unicode+html символы, а не прямо unicode. Действительно ли это - ошибка или недоразумение?

Я использую BeautifulSoup для очистки веб-сайта. Рендеринг страницы веб-сайта, прекрасный в моем браузере: отчет Oxfam International, наделенный правом “Вне игры! http://www.coopamerica.org/programs/responsibleshopper/...
вопрос задан: 10 March 2009 13:09
2
ответа

BeautifulSoup - изменение всех ссылок в части HTML?

Я должен быть в состоянии изменить каждую ссылку в документе HTML. Я знаю, что должен использовать SoupStrainer, но я не на 100% положителен относительно того, как реализовать его. Если кто-то мог бы направить меня к пользе...
вопрос задан: 20 January 2009 02:52
1
ответ

Действительно ли возможно использовать Python lxml на Google App Engine?

Я могу использовать Python lxml на Google App Engine? (или я должен использовать Красивый Суп?) Я начал использовать Красивый Суп, но это кажется медленным. Я только начинаю играть с идеей "анализа экранных данных"...
вопрос задан: 11 October 2019 12:22
1
ответ

How to find elements by class

I'm having trouble parsing HTML elements with "class" attribute using Beautifulsoup. The code looks like this soup = BeautifulSoup(sdata) mydivs = soup.findAll ('div') for div in mydivs: if (div["...
вопрос задан: 29 May 2019 19:41
1
ответ

Python строка заменить теги

Я анализирую текст HTML / xml и удаляю из него набор тегов, таких как fs, img, используя BeautifulSoup. Документ, который я анализирую, имеет тег < тег ... > вместо тега < tag .... / > Итак, я хотел ...
вопрос задан: 14 April 2019 11:02
1
ответ

Веб-очистка Python с использованием Soap + Request

Я пытаюсь получить информацию о ссылке, используя мыло в Python. Я могу получить весь массив с информацией, но я не знаю, как манипулировать информацией так, как я хочу. Например:...
вопрос задан: 14 April 2019 01:34
1
ответ

Как анализировать загруженные файлы HTML и создавать списки

Я скачал несколько HTML-файлов, которые хочу проанализировать. Мне удалось разобрать файлы, но теперь я хочу составить несколько списков, чтобы я мог составить точечный график. Я совершенно новичок в Python, поэтому я не уверен, как ...
вопрос задан: 25 March 2019 00:44