1
ответ

Как я могу пользоваться библиотекой HTMLParser Python для извлечения данных из определенного тега Div?

Я пытаюсь вытащить значение из страницы HTML, пользующейся библиотекой HTMLParser Python. Значение, которым я хочу овладеть, в этом элементе HTML:... <идентификатор отделения = "remository"> 20 </отделение>... Это...
вопрос задан: 19 July 2010 11:15
1
ответ

Доступ к HTML, сгенерированному JavaScript с htmlunit - Java

Я пытаюсь смочь протестировать веб-сайт, который использует JavaScript для рендеринга большей части HTML. С браузером HTMLUNIT, как Вы смогли бы получить доступ к HTML, сгенерированному JavaScript? Я смотрел...
вопрос задан: 2 June 2010 22:05
1
ответ

Подсказки для парсинга HTML и веб-управления с clojure?

Я хочу автоматизировать заполнение данных по веб-сайту с помощью clojure. Для этого я хочу к элементам запроса веб-страниц и создаю запросы HTTP. Я смотрел на использование HttpUnit и contrib.clojure.zip-...
вопрос задан: 27 May 2010 00:37
1
ответ

C#: HtmlAgilityPack извлекают внутренний текст

Я использую HtmlAgilityPack. Существует ли один линейный код, что я могу получить весь внутренний текст HTML, например, удалить все теги HTML и сценарии?
вопрос задан: 26 May 2010 15:27
1
ответ

Пакет гибкости HTML

Я хочу проанализировать таблицу HTML с помощью пакета гибкости HTML. Я хочу извлечь только некоторые предопределенные данные столбца из таблицы. Но я плохо знаком с парсингом и пакетом гибкости HTML, и я попробовал, но я не делаю...
вопрос задан: 12 March 2010 05:21
0
ответов

Парсер Java HTML Jsoup : Выполнение событий Javascript

Могу ли я заполнять формы, выполнять события и функции Javascript в Jsoup? Если да, то как? Или мне стоит попробовать другой парсер.
вопрос задан: 25 September 2019 17:22
0
ответов

Изменение стиля HTML-ссылок в текстовых просмотре после выполнения HTML.FROMHTML

Я разрабатываю приложение Android. Я извлекаю некоторые данные, которые выглядят так: Моя ссылка на Google!
вопрос задан: 12 August 2019 20:31
0
ответов

PHP DOM :анализирует список HTML в массив?

У меня есть приведенная ниже строка HTML, и я хотел бы превратить ее в массив. $строка = ' 1 2
вопрос задан: 1 July 2019 05:29
0
ответов

Как извлечь строку по шаблону с помощью grep, regex или perl

У меня есть файл, который выглядит примерно так:
...
вопрос задан: 13 November 2018 17:21
0
ответов

Как удалить HTML-теги из строки в JavaScript? [дубликат]

Возможный дубликат: убрать HTML из текста JavaScript Как удалить HTML из строки в JavaScript?
вопрос задан: 8 October 2018 05:50
0
ответов

VIM + Python - команда «gd» не работает должным образом

Я начинаю использовать VIM для программирования Python. Я столкнулся с некоторыми проблемами, надеюсь, кто-то может мне помочь с этим. Предполагается, что команда "gd" выведет вас на первое место, где переменная ...
вопрос задан: 28 August 2018 13:50
0
ответов

HTML-текст с тегами для форматированного текста в ячейке Excel

Есть ли способ взять HTML и импортировать его в Excel, чтобы он был отформатирован как расширенный текст (желательно с использованием VBA)? По сути, когда я вставляю в ячейку Excel, я хочу включить это: < html > < ...
вопрос задан: 27 June 2018 14:10
0
ответов

Parse строка HTML с JS

Я искал решение, но ничего не подходило, поэтому вот моя проблема: я хочу проанализировать строку, содержащую текст HTML. Я хочу сделать это в JavaScript. Я попробовал эту библиотеку, но оказалось, что она...
вопрос задан: 23 April 2018 23:37
0
ответов

Удалить теги
из проанализированного списка Beautiful Soup?

В настоящее время я попадаю в цикл for со всеми строками, которые мне нужны: soup = BeautifulSoup (страница) table = soup.find ("td", "bodyTd") для строки в таблицах.findAll ('tr'): В этом ...
вопрос задан: 14 March 2018 14:59
0
ответов

Как получить значение узла/innerHTML с помощью XPath?

У меня есть XPath для выбора класса, который я хочу: //div[@class='myclass']. Но он возвращает мне весь div (также с
, но я хотел бы вернуть только содержимое этого...
вопрос задан: 6 October 2017 19:46
0
ответов

Как я могу получить все содержимое внутри тега с помощью регулярного выражения?

Как мне получить все содержимое внутри тега с помощью регулярного выражения? Например,

xx

xx & ...

вопрос задан: 23 May 2017 12:34
0
ответов

Работа с повторяющимися идентификаторами в selenium webdriver

Я пытаюсь автоматизировать некоторые тесты с помощью selenium webdriver. Я имею дело со сторонним -поставщиком входа в систему (OAuth ), который использует повторяющиеся идентификаторы в своем html. В результате не могу "найти" вход...
вопрос задан: 23 May 2017 12:32
0
ответов

RegEx для получения href и src из содержимого HTML?

Я пытаюсь извлечь ссылки href и src из строки HTML. Согласно этому сообщению, я смог получить часть изображения. Может ли кто-нибудь помочь настроить регулярное выражение для включения URL-адреса href в ...
вопрос задан: 23 May 2017 12:29
0
ответов

Использование HTMLParser в Python 3.2

Я использовал HTML Parser для извлечения данных с веб-сайтов и удаления html-кода при этом. Я знаю о различных модулях, таких как Beautiful Soup, но решил пойти по пути не...
вопрос задан: 23 May 2017 12:18
0
ответов

Jsoup: Извлечь весь HTML между двумя блоками в CSS меньше HTML

, Что было бы оптимальным путем, с помощью Jsoup, для извлечения всего HTML (или к Последовательности, Документу или к Элементам) между двумя блоками, которые соответствуют этому образцу: <сильный> {любой HTML мог появиться здесь...
вопрос задан: 23 May 2017 12:07
0
ответов

Как исправить эту ошибку AttributeError?

Вчера я установил полосовой пакет, и теперь мое приложение не работает. Я пытаюсь понять, в чем проблема. Это как-то связано с PyShell, HTLParser или чем-то еще. Я отправляю ...
вопрос задан: 23 May 2017 12:02
0
ответов

Как работают парсеры HTML?

Я видел юмористические темы и читал предупреждения, и я знаю, что вы не анализируете HTML с помощью регулярных выражений. Не волнуйтесь ... Я не собираюсь пробовать. НО ... это заставляет меня спрашивать: как работают парсеры HTML ...
вопрос задан: 23 May 2017 12:00
0
ответов

Почему лишний закрывающий тег

создает пустой абзац?

По-видимому, если у вас есть конечный тег

без соответствующего начального тега в элементе body, большинство, если не все браузеры, создадут вместо него пустой абзац : <...
вопрос задан: 23 May 2017 11:53
0
ответов

Ищу синтаксический анализатор CSS на Ruby [закрыто]

Я ищу синтаксический анализатор CSS, похожий на этот. Ищу синтаксический анализатор CSS на java, но на Ruby. Вход: элемент HTML-документа. Вывод: все стили, связанные с этим конкретным элементом. Я ...
вопрос задан: 23 May 2017 11:44
0
ответов

Parsing html -> xml and querying with Xpath

I want to parse a html page to get some data. First, I convert it to XML document using SgmlReader. Then, I load the result to XMLDocument and then navigate through XPath: //contains html document ...
вопрос задан: 29 April 2017 16:31
0
ответов

Может любой из Ruby ' s Парсеры HTML делают JavaScript, чтобы увидеть получившийся DOM?

При попытке использовать Hpricot и Nokogiri, HTML можно получить и проанализировать, но могут ли они также выполнить Javascript, чтобы содержимое отображалось на странице? (появляется в DOM). Это ...
вопрос задан: 20 April 2017 00:02
0
ответов

Выбор узлов HTML Agility Pack

Я пытаюсь использовать пакет HTML Agility для очистки некоторых данных с сайта. Я действительно изо всех сил пытаюсь понять, как использовать selectnodes внутри foreach, а затем экспортировать данные в список или массив ....
вопрос задан: 21 October 2016 15:38
0
ответов

Какие модули Perl лучше всего подходят для изменения данных?

Девять лет назад, когда я начал анализировать HTML и свободный текст с помощью Perl, я прочитал классическое преобразование данных с помощью Perl. Кто-нибудь знает, планирует ли Дэвид обновить книгу или есть ли похожие книги ...
вопрос задан: 28 July 2016 05:21
0
ответов

Разбор HTML с помощью Python

Я ищу модуль HTML Parser для Python, который может помочь мне получить теги в виде списков/словарей/объектов Python. Если у меня есть документ вида : Заголовок<...
вопрос задан: 27 April 2016 23:55
0
ответов

Как извлечь данные из таблицы HTML в сценарии оболочки?

Я пытаюсь создать сценарий BASH, который будет извлекать данные из таблицы HTML. Ниже приведен пример таблицы, из которой мне нужно извлечь данные:
...
вопрос задан: 10 October 2015 18:29