html-parsing - список вопросов по программированию html-parsing

ответ

Как я могу пользоваться библиотекой HTMLParser Python для извлечения данных из определенного тега Div?

Я пытаюсь вытащить значение из страницы HTML, пользующейся библиотекой HTMLParser Python. Значение, которым я хочу овладеть, в этом элементе HTML:... <идентификатор отделения = "remository"> 20 </отделение>... Это...

вопрос задан: 19 July 2010 11:15

ответ

Доступ к HTML, сгенерированному JavaScript с htmlunit - Java

Я пытаюсь смочь протестировать веб-сайт, который использует JavaScript для рендеринга большей части HTML. С браузером HTMLUNIT, как Вы смогли бы получить доступ к HTML, сгенерированному JavaScript? Я смотрел...

java javascript html-parsing htmlunit

вопрос задан: 2 June 2010 22:05

ответ

Подсказки для парсинга HTML и веб-управления с clojure?

Я хочу автоматизировать заполнение данных по веб-сайту с помощью clojure. Для этого я хочу к элементам запроса веб-страниц и создаю запросы HTTP. Я смотрел на использование HttpUnit и contrib.clojure.zip-...

clojure html-parsing clojure-contrib

вопрос задан: 27 May 2010 00:37

ответ

C#: HtmlAgilityPack извлекают внутренний текст

Я использую HtmlAgilityPack. Существует ли один линейный код, что я могу получить весь внутренний текст HTML, например, удалить все теги HTML и сценарии?

c# html-parsing

вопрос задан: 26 May 2010 15:27

ответ

Пакет гибкости HTML

Я хочу проанализировать таблицу HTML с помощью пакета гибкости HTML. Я хочу извлечь только некоторые предопределенные данные столбца из таблицы. Но я плохо знаком с парсингом и пакетом гибкости HTML, и я попробовал, но я не делаю...

c# .net winforms html-parsing html-agility-pack

вопрос задан: 12 March 2010 05:21

ответов

Парсер Java HTML Jsoup : Выполнение событий Javascript

Могу ли я заполнять формы, выполнять события и функции Javascript в Jsoup? Если да, то как? Или мне стоит попробовать другой парсер.

java jsoup html-parsing dom-events

вопрос задан: 25 September 2019 17:22

ответов

Изменение стиля HTML-ссылок в текстовых просмотре после выполнения HTML.FROMHTML

Я разрабатываю приложение Android. Я извлекаю некоторые данные, которые выглядят так: Моя ссылка на Google! java android textview html-parsing text-styling

вопрос задан: 12 August 2019 20:31

0
ответов

PHP DOM :анализирует список HTML в массив?

У меня есть приведенная ниже строка HTML, и я хотел бы превратить ее в массив. $строка = ' 1 2
html-parsing php-5.3 php dom

вопрос задан: 1 July 2019 05:29

0
ответов

Как извлечь строку по шаблону с помощью grep, regex или perl

У меня есть файл, который выглядит примерно так:

...
regex perl sed html-parsing text-extraction
вопрос задан: 13 November 2018 17:21

0
ответов

Как удалить HTML-теги из строки в JavaScript? [дубликат]

Возможный дубликат: убрать HTML из текста JavaScript Как удалить HTML из строки в JavaScript?

javascript html-parsing

вопрос задан: 8 October 2018 05:50

0
ответов

VIM + Python - команда «gd» не работает должным образом

Я начинаю использовать VIM для программирования Python. Я столкнулся с некоторыми проблемами, надеюсь, кто-то может мне помочь с этим. Предполагается, что команда "gd" выведет вас на первое место, где переменная ...

java pdf-generation html-parsing itext

вопрос задан: 28 August 2018 13:50

0
ответов

HTML-текст с тегами для форматированного текста в ячейке Excel

Есть ли способ взять HTML и импортировать его в Excel, чтобы он был отформатирован как расширенный текст (желательно с использованием VBA)? По сути, когда я вставляю в ячейку Excel, я хочу включить это: < html > < ...

html-parsing excel-vba vba excel

вопрос задан: 27 June 2018 14:10

0
ответов

Parse строка HTML с JS

Я искал решение, но ничего не подходило, поэтому вот моя проблема: я хочу проанализировать строку, содержащую текст HTML. Я хочу сделать это в JavaScript. Я попробовал эту библиотеку, но оказалось, что она...

html html-parsing javascript dom

вопрос задан: 23 April 2018 23:37

0
ответов

Удалить теги
из проанализированного списка Beautiful Soup?

В настоящее время я попадаю в цикл for со всеми строками, которые мне нужны: soup = BeautifulSoup (страница) table = soup.find ("td", "bodyTd") для строки в таблицах.findAll ('tr'): В этом ...

python beautifulsoup html-parsing

вопрос задан: 14 March 2018 14:59

0
ответов

Как получить значение узла/innerHTML с помощью XPath?

У меня есть XPath для выбора класса, который я хочу: //div[@class='myclass']. Но он возвращает мне весь div (также с
, но я хотел бы вернуть только содержимое этого...

html-parsing parsing xml xpath

вопрос задан: 6 October 2017 19:46

0
ответов

Как я могу получить все содержимое внутри тега с помощью регулярного выражения?

Как мне получить все содержимое внутри тега с помощью регулярного выражения? Например,
xx

xx & ...

php regex html-parsing

вопрос задан: 23 May 2017 12:34

0
ответов

Работа с повторяющимися идентификаторами в selenium webdriver

Я пытаюсь автоматизировать некоторые тесты с помощью selenium webdriver. Я имею дело со сторонним -поставщиком входа в систему (OAuth ), который использует повторяющиеся идентификаторы в своем html. В результате не могу "найти" вход...

html-parsing selenium-webdriver webdriver xpath

вопрос задан: 23 May 2017 12:32

0
ответов

RegEx для получения href и src из содержимого HTML?

Я пытаюсь извлечь ссылки href и src из строки HTML. Согласно этому сообщению, я смог получить часть изображения. Может ли кто-нибудь помочь настроить регулярное выражение для включения URL-адреса href в ...

c# html regex html-parsing

вопрос задан: 23 May 2017 12:29

0
ответов

Использование HTMLParser в Python 3.2

Я использовал HTML Parser для извлечения данных с веб-сайтов и удаления html-кода при этом. Я знаю о различных модулях, таких как Beautiful Soup, но решил пойти по пути не...

arguments html-parsing stripping web-scraping python-3.x

вопрос задан: 23 May 2017 12:18

0
ответов

Jsoup: Извлечь весь HTML между двумя блоками в CSS меньше HTML

, Что было бы оптимальным путем, с помощью Jsoup, для извлечения всего HTML (или к Последовательности, Документу или к Элементам) между двумя блоками, которые соответствуют этому образцу: <сильный> {любой HTML мог появиться здесь...

java html-parsing jsoup

вопрос задан: 23 May 2017 12:07

0
ответов

Как исправить эту ошибку AttributeError?

Вчера я установил полосовой пакет, и теперь мое приложение не работает. Я пытаюсь понять, в чем проблема. Это как-то связано с PyShell, HTLParser или чем-то еще. Я отправляю ...

python html google-app-engine html-parsing attributeerror

вопрос задан: 23 May 2017 12:02

0
ответов

Как работают парсеры HTML?

Я видел юмористические темы и читал предупреждения, и я знаю, что вы не анализируете HTML с помощью регулярных выражений. Не волнуйтесь ... Я не собираюсь пробовать. НО ... это заставляет меня спрашивать: как работают парсеры HTML ...

regex html-parsing

вопрос задан: 23 May 2017 12:00

0
ответов

Почему лишний закрывающий тег
создает пустой абзац?

По-видимому, если у вас есть конечный тег
без соответствующего начального тега в элементе body, большинство, если не все браузеры, создадут вместо него пустой абзац : <...

html html5 html-parsing dom syntax

вопрос задан: 23 May 2017 11:53

0
ответов

Ищу синтаксический анализатор CSS на Ruby [закрыто]

Я ищу синтаксический анализатор CSS, похожий на этот. Ищу синтаксический анализатор CSS на java, но на Ruby. Вход: элемент HTML-документа. Вывод: все стили, связанные с этим конкретным элементом. Я ...

html css ruby parsing html-parsing

вопрос задан: 23 May 2017 11:44

0
ответов

Parsing html -> xml and querying with Xpath

I want to parse a html page to get some data. First, I convert it to XML document using SgmlReader. Then, I load the result to XMLDocument and then navigate through XPath: //contains html document ...

c# .net xml html-parsing

вопрос задан: 29 April 2017 16:31

0
ответов

Может любой из Ruby ' s Парсеры HTML делают JavaScript, чтобы увидеть получившийся DOM?

При попытке использовать Hpricot и Nokogiri, HTML можно получить и проанализировать, но могут ли они также выполнить Javascript, чтобы содержимое отображалось на странице? (появляется в DOM). Это ...

javascript ruby html-parsing nokogiri hpricot

вопрос задан: 20 April 2017 00:02

0
ответов

Выбор узлов HTML Agility Pack

Я пытаюсь использовать пакет HTML Agility для очистки некоторых данных с сайта. Я действительно изо всех сил пытаюсь понять, как использовать selectnodes внутри foreach, а затем экспортировать данные в список или массив ....

c# html-parsing html-agility-pack

вопрос задан: 21 October 2016 15:38

0
ответов

Какие модули Perl лучше всего подходят для изменения данных?

Девять лет назад, когда я начал анализировать HTML и свободный текст с помощью Perl, я прочитал классическое преобразование данных с помощью Perl. Кто-нибудь знает, планирует ли Дэвид обновить книгу или есть ли похожие книги ...

perl xml-parsing html-parsing text-parsing data-munging

вопрос задан: 28 July 2016 05:21

0
ответов

Разбор HTML с помощью Python

Я ищу модуль HTML Parser для Python, который может помочь мне получить теги в виде списков/словарей/объектов Python. Если у меня есть документ вида : Заголовок<...

html-parsing python xml-parsing

вопрос задан: 27 April 2016 23:55

0
ответов

Как извлечь данные из таблицы HTML в сценарии оболочки?

Я пытаюсь создать сценарий BASH, который будет извлекать данные из таблицы HTML. Ниже приведен пример таблицы, из которой мне нужно извлечь данные:

...
html regex shell sed html-parsing

вопрос задан: 10 October 2015 18:29

1
2
3
4
5
6
7
8

© 2017 - 2020 Вопросы и ответы по программированию