Я пытаюсь вытащить значение из страницы HTML, пользующейся библиотекой HTMLParser Python. Значение, которым я хочу овладеть, в этом элементе HTML:... <идентификатор отделения = "remository"> 20 </отделение>... Это...
Я пытаюсь смочь протестировать веб-сайт, который использует JavaScript для рендеринга большей части HTML. С браузером HTMLUNIT, как Вы смогли бы получить доступ к HTML, сгенерированному JavaScript? Я смотрел...
Я хочу автоматизировать заполнение данных по веб-сайту с помощью clojure. Для этого я хочу к элементам запроса веб-страниц и создаю запросы HTTP. Я смотрел на использование HttpUnit и contrib.clojure.zip-...
Я использую HtmlAgilityPack. Существует ли один линейный код, что я могу получить весь внутренний текст HTML, например, удалить все теги HTML и сценарии?
Я хочу проанализировать таблицу HTML с помощью пакета гибкости HTML. Я хочу извлечь только некоторые предопределенные данные столбца из таблицы. Но я плохо знаком с парсингом и пакетом гибкости HTML, и я попробовал, но я не делаю...
Я начинаю использовать VIM для программирования Python. Я столкнулся с некоторыми проблемами, надеюсь, кто-то может мне помочь с этим. Предполагается, что команда "gd" выведет вас на первое место, где переменная ...
Есть ли способ взять HTML и импортировать его в Excel, чтобы он был отформатирован как расширенный текст (желательно с использованием VBA)? По сути, когда я вставляю в ячейку Excel, я хочу включить это: < html > < ...
Я искал решение, но ничего не подходило, поэтому вот моя проблема: я хочу проанализировать строку, содержащую текст HTML. Я хочу сделать это в JavaScript. Я попробовал эту библиотеку, но оказалось, что она...
В настоящее время я попадаю в цикл for со всеми строками, которые мне нужны:
soup = BeautifulSoup (страница)
table = soup.find ("td", "bodyTd")
для строки в таблицах.findAll ('tr'): В этом ...
Я пытаюсь автоматизировать некоторые тесты с помощью selenium webdriver. Я имею дело со сторонним -поставщиком входа в систему (OAuth ), который использует повторяющиеся идентификаторы в своем html. В результате не могу "найти" вход...
Я пытаюсь извлечь ссылки href и src из строки HTML. Согласно этому сообщению, я смог получить часть изображения. Может ли кто-нибудь помочь настроить регулярное выражение для включения URL-адреса href в ...
Я использовал HTML Parser для извлечения данных с веб-сайтов и удаления html-кода при этом. Я знаю о различных модулях, таких как Beautiful Soup, но решил пойти по пути не...
, Что было бы оптимальным путем, с помощью Jsoup, для извлечения всего HTML (или к Последовательности, Документу или к Элементам) между двумя блоками, которые соответствуют этому образцу: <сильный> {любой HTML мог появиться здесь...
Вчера я установил полосовой пакет, и теперь мое приложение не работает. Я пытаюсь понять, в чем проблема. Это как-то связано с PyShell, HTLParser или чем-то еще. Я отправляю ...
Я видел юмористические темы и читал предупреждения, и я знаю, что вы не анализируете HTML с помощью регулярных выражений. Не волнуйтесь ... Я не собираюсь пробовать. НО ... это заставляет меня спрашивать: как работают парсеры HTML ...
По-видимому, если у вас есть конечный тег без соответствующего начального тега в элементе body, большинство, если не все браузеры, создадут вместо него пустой абзац : <...
Я ищу синтаксический анализатор CSS, похожий на этот. Ищу синтаксический анализатор CSS на java, но на Ruby. Вход: элемент HTML-документа. Вывод: все стили, связанные с этим конкретным элементом. Я ...
I want to parse a html page to get some data.
First, I convert it to XML document using SgmlReader.
Then, I load the result to XMLDocument and then navigate through XPath: //contains html document
...
При попытке использовать Hpricot и Nokogiri, HTML можно получить и проанализировать, но могут ли они также выполнить Javascript, чтобы содержимое отображалось на странице? (появляется в DOM). Это ...
Я пытаюсь использовать пакет HTML Agility для очистки некоторых данных с сайта. Я действительно изо всех сил пытаюсь понять, как использовать selectnodes внутри foreach, а затем экспортировать данные в список или массив ....
Девять лет назад, когда я начал анализировать HTML и свободный текст с помощью Perl, я прочитал классическое преобразование данных с помощью Perl. Кто-нибудь знает, планирует ли Дэвид обновить книгу или есть ли похожие книги ...
Я ищу модуль HTML Parser для Python, который может помочь мне получить теги в виде списков/словарей/объектов Python. Если у меня есть документ вида : Заголовок<...