beautifulsoup - список вопросов по программированию beautifulsoup

1

ответ

Очистить от CENTRAL iframe [duplicate]

Я работаю над проектом по очистке данных из Библиотеки Кокрейн (CENTRAL). Например, со страницы, подобной этой, я хочу получить дизайн исследования статей (т. Е. RCT). Чтобы сделать это, я написал следующее ...

вопрос задан: 12 April 2014 10:40

1

ответ

Как Вы получаете все строки от конкретного использования таблицы BeautifulSoup?

Я изучаю Python и BeautifulSoup, чтобы очистить данные из сети и прочитать HTML-таблицу. Я могу читать, это в Открывает Office, и это говорит, что это - Таблица № 11. Кажется, что BeautifulSoup...

python beautifulsoup

вопрос задан: 29 November 2013 14:00

1

ответ

Как найти таблицу с помощью beautifulsoup без имени? Для python [duplicate]

Я пытаюсь найти третью таблицу с веб-сайта http://indexarb.com/index.html. но я не могу найти уникальное имя таблицы. valueim пытается получить текст в первом столбце: «S & amp; P 500 Prem ...

python beautifulsoup

вопрос задан: 19 June 2013 17:04

1

ответ

сохранение таблицы в файл csv в python [duplicate]

Я написал этот код для извлечения таблицы с сайта и сохранения в файл csv ... проблема в том, что она сохраняет таблицу в одной строке. как я могу сохранить исходный формат таблицы? Я хочу 5 столбцов в ...

python csv beautifulsoup python-requests

вопрос задан: 5 January 2013 02:54

1

ответ

Как я могу получить доступ к namespaced XML использование элементов BeautifulSoup?

У меня есть XML-документ, который читает как это: <xml> <web:Web> <web:Total> 4000 </web:total> <web:Offset> 0 </web:offset> </web:web> </xml> мой вопрос...

python xml xml-parsing beautifulsoup xml-namespaces

вопрос задан: 28 September 2012 01:35

1

ответ

BeautifulSoup не показывает полный источник страницы [дубликат]

Я пытаюсь проанализировать этот сайт с помощью BeautifulSoup, однако, когда я проверяю источник страницы, html, который я ищу, отсутствует и поэтому не может быть очищен. Источник страницы кажется другим ...

python beautifulsoup

вопрос задан: 22 January 2012 11:59

1

ответ

Как найти тег комментария с BeautifulSoup?

Я попробовал soup.find ('! -'), но похоже, что он не работает . Заранее спасибо. Изменить: Спасибо за совет о том, как найти все комментарии. У меня есть дополнительный вопрос. Как мне конкретно искать ...

python html tags beautifulsoup

вопрос задан: 19 May 2011 17:34

1

ответ

BeautifulSoup и ASP.NET/C#

Кто-либо интегрировал BeautifulSoup с ASP.NET/C# (возможно использующий IronPython или иначе)? Есть ли альтернатива BeautifulSoup или порт, который работает приятно с ASP.NET/C# намерение планирования...

c# asp.net screen-scraping ironpython beautifulsoup

вопрос задан: 28 July 2010 20:23

1

ответ

уродливая ошибка тегов запуска - Python, BeautifulSoup, и Sipie - Ubuntu 10.04

Я просто установил Python, mplayer, beautifulsoup и sipie для выполнения Сириуса на моей машине Ubuntu 10.04. Я следовал некоторым документам, которые кажутся простыми, но встречаюсь с некоторыми проблемами. Я не это...

python beautifulsoup

вопрос задан: 7 July 2010 21:13

1

ответ

BeautifulSoup: просто проникните внутрь тега, неважно, сколько включающих тегов, там

Я пытаюсь очистить весь внутренний HTML от <p> элементов в использовании веб-страницы BeautifulSoup. Существуют внутренние теги, но я не забочусь, я просто хочу получить внутренний текст. Например...

python beautifulsoup

вопрос задан: 2 June 2010 12:02

1

ответ

Параметры для функции находки

Я использую красивый суп (в Python). У меня есть такой скрытый входной объект: <входной тип = "скрытое" имя = "form_build_id" идентификатор = "формируют-531f740522f8c290ead9b88f3da026d2" значение = "форма-...

python find beautifulsoup

вопрос задан: 20 May 2010 19:29

1

ответ

В Python BeautifulSoup, Как переместить теги

У меня есть частично преобразованный XML-документ в супе, прибывающем из HTML. После некоторой замены и редактирующий в супе, тело по существу - <Текст...> </текст> #, Это заменяет <...

python xml regex beautifulsoup children

вопрос задан: 28 April 2010 20:30

1

ответ

Красивый Unicode Супа кодирует ошибку

Я пробую следующий код конкретным файлом HTML от импорта BeautifulSoup, кодеки импорта ре импорта BeautifulSoup импортируют sys f =, открывают ('test1.html') HTML = f.read () суп = BeautifulSoup (HTML)...

python unicode beautifulsoup

вопрос задан: 13 April 2010 04:58

1

ответ

Используя findAll BeautifulSoup для поиска innerText элемента HTML для получения того же результата как ищущие атрибуты?

Например, если я ищу атрибутом элемента как идентификатор: soup.findAll ('промежуток', {'идентификатор ':re.compile (" ^score _ ")}) я возвращаю список целого элемента промежутка, который соответствует (который я люблю). Но если я...

python beautifulsoup

вопрос задан: 5 April 2010 19:11

1

ответ

Используйте BeautifulSoup для извлечения одноуровневых узлов между двумя узлами

У меня есть документ как это: <p класс = "вершина"> я не хочу этот </p> <p>, я хочу этот </p> <таблица> <!-...-> </таблица> <img.../> <p> и...

python beautifulsoup

вопрос задан: 24 March 2010 11:46

1

ответ

Как я могу использовать BeautifulSoup для нахождения всех ссылок на странице, указывающей на определенный домен?

python beautifulsoup

вопрос задан: 28 January 2010 05:03

1

ответ

Используя BeautifulSoup для нахождения HTML-тэга, который содержит определенный текст

Я пытаюсь получить элементы в документе HTML, которые содержат следующий шаблон текста: #\\S {11} <h2>, это - прохладный № 12345678901 </h2> Так, предыдущее, соответствовал бы при помощи: суп ('h2'...

python regex beautifulsoup html-content-extraction

вопрос задан: 28 December 2009 16:13

1

ответ

BeautifulSoup - извлечение значений атрибута

Если Красивый Суп дает мне тег привязки как это: <класс = "и тому подобное" идентификатор = "и тому подобное" href = "link.html"> </a>, Как я получил бы значение атрибута href?

python beautifulsoup

вопрос задан: 5 November 2009 22:38

1

ответ

lxml, эквивалентный BeautifulSoup “ИЛИ” синтаксису?

Я преобразовываю некоторый код парсинга HTML от BeautifulSoup до lxml. Я пытаюсь выяснить lxml эквивалентный синтаксис для следующего оператора BeautifullSoup: soup.find ({'класс': ['текущий...

python beautifulsoup lxml

вопрос задан: 5 September 2009 23:04

1

ответ

Используя Красивый Суп, как я выполняю итерации по всему встроенному тексту?

Скажем, я хотел удалить гласные из HTML: <href = "нечто"> Привет там! </a> Привет! становится <href = "нечто"> ЯПВУ thr! </a> H! Я полагаю, что это - задание для Красивого Супа. Как может я...

python beautifulsoup

вопрос задан: 6 May 2009 19:34

1

ответ

Как я выполняю итерации по HTML-атрибутам Красивого элемента Супа?

Как я выполняю итерации по HTML-атрибутам Красивого элемента Супа? Как, данный: <панель нечто = "asdf" вздор = "123"> xyz </нечто> я хочу "панель" и "вздор".

python beautifulsoup

вопрос задан: 4 May 2009 23:14

1

ответ

Препятствование тому, чтобы BeautifulSoup преобразовал мои XML-тэги в нижний регистр

Я использую BeautifulStoneSoup, чтобы проанализировать XML-документ и изменить некоторые атрибуты. Я заметил, что это автоматически преобразовывает все XML-тэги в нижний регистр. Например, мой исходный файл имеет <DocData>...

beautifulsoup xml python

вопрос задан: 20 February 2009 02:35

0

ответов

Escape unescaped characters in XML with Python

I need to escape special characters in an invalid XML file which is about 5000 lines long. Here's an example of the XML that I have to deal with: name &...

python xml beautifulsoup lxml special-characters

вопрос задан: 11 August 2019 14:09

0

ответов

Извлечь содержимое в теге с помощью BeautifulSoup

Я хочу извлечь содержимое Hello world. Обратите внимание, что на странице есть кратные и похожие

:

python beautifulsoup

вопрос задан: 6 August 2019 16:59

0

ответов

с использованием nextSibling от BeautifulSoup ничего не выводит

Я пытаюсь использовать BeautifulSoup в следующих случаях:

Здравствуйте,

hiya 28 мая 1996 г.

Для этого ...

python beautifulsoup

вопрос задан: 10 July 2019 11:56

0

ответов

Как найти дочерние узлы с помощью BeautifulSoup

Я хочу получить все теги , которые являются дочерними для

:

link1

link2 <...

python html beautifulsoup

вопрос задан: 17 May 2019 20:52

0

ответов

Удалить 'urllib.error.HTTPError: Ошибка HTTP 302:' из urlReq (url)

Эй ребята, как дела? :) Я пытаюсь очистить сайт с некоторыми параметрами URL. Если я использую url1, url2, url3, он работает должным образом, и он печатает мне обычный вывод, который я хочу (html) -> импортировать bs4 из ...

python url cookies beautifulsoup urllib

вопрос задан: 29 March 2019 09:47

0

ответов

Python 3.7 - PhantomJS - Driver.get (url) с «Описатель окна / имя неверно или закрыто?»

Использование двух функций для очистки сайта приводит к ошибке driver.get. Я пробовал разные варианты цикла while и for, чтобы заставить это работать. Теперь я получаю ошибку driver.get. Начальная функция ...

web-scraping beautifulsoup phantomjs python-3.7

вопрос задан: 28 March 2019 05:51

0

ответов

Данные в .csv повторяются три раза. Мне нужно три разных записок экспортируется в CSV-файл

Файлы CSV повторяют ту же информацию. Мне нужна обновленная информация, отправленная на лист Excel из трех встроенных источников. Есть код, который связывает href с базовой страницы с ...

python beautifulsoup

вопрос задан: 26 March 2019 20:08

0

ответов

Суппрейнер и php не могут видеть все найденные дивы

Я пытаюсь заполнить форму с помощью Python, а затем получить полученную страницу, чтобы использовать ее в моем файле .php. Код Python: def sitecheck (SITE_URL2): URL2 = "https://achecker.ca/checker/index.php" ...

php python beautifulsoup

вопрос задан: 17 March 2019 21:10

1
2
3
4
5
6
7
8
9
10
11