html-parsing - список вопросов по программированию html-parsing

3

ответа

Странное поведение CSS … удаление границы на 1 пкс заставляет <DIV> переместиться 20 пкс

У меня есть следующее: CSS #pageBody {высота: 500 пкс; padding:0; margin:0;/*border: твердый # 00ff00 на 1 пкс; */} #pageContent {height:460px; поле-left:35px; поле-right:...

css html-parsing

вопрос задан: 31 May 2010 12:30

2

ответа

Реализация универсального веб-скребка с использованием Node.js

Я хотел бы реализовать базовый веб-скребок, используя Node.js, который является настолько универсальным, насколько это возможно. Я хочу, чтобы приложение могло анализировать и возвращать текст из любого HTML, игнорируя любую разметку / CSS / ...

node.js web-scraping html-parsing cheerio

вопрос задан: 15 January 2019 15:29

2

ответа

Анализ HTML из GMail с помощью скриптов приложений

Я хочу создать скрипт, который будет получать электронную почту с ее необработанным HTML, проанализировать HTML с помощью службы XML и вытащить различные биты данных. Моя проблема в том, что, когда вы тянете через HTML, используя ...

google-apps-script gmail html-parsing

вопрос задан: 13 July 2018 16:35

2

ответа

Пакет Гибкости HTML - таблицы синтаксического анализа

Я хочу использовать пакет гибкости HTML для таблиц синтаксического анализа от сложных веб-страниц, но я так или иначе потерян в объектной модели. Я посмотрел на пример ссылки, но не нашел данные таблицы этим путем. Могу я...

c# html html-parsing html-agility-pack

вопрос задан: 12 January 2016 16:38

2

ответа

Как я преобразовываю строку в UTF-8 в Android?

Я использую синтаксический анализатор HTML под названием Jsoup, чтобы загрузить и проанализировать файлы HTML. Проблема состоит в том, что веб-страница, которую я очищаю, кодируется в наборе символов ISO-8859-1, в то время как Android использует кодировку

java android html html-parsing jsoup

вопрос задан: 7 April 2015 16:36

2

ответа

Как я могу удалить атрибуты из HTML-тега?

Как я могу использовать php для удаления всех / любых атрибутов из тега, скажем, тега абзаца?

в

html-parsing php

вопрос задан: 16 May 2014 20:02

2

ответа

Python потребности lxml справка синтаксиса для парсинга HTML

Я являюсь совершенно новым к Python, и я нуждаюсь в некоторой помощи с синтаксисом для нахождения и итерации через теги HTML с помощью lxml. Вот примеры использования, с которыми я имею дело: файл HTML довольно хорошо формируется (но...

lxml html-parsing python

вопрос задан: 27 May 2013 08:58

2

ответа

Nokogiri по сравнению с Hpricot?

Какой Вы выбрали бы? Мои важные атрибуты (не в порядке): Поддержка и будущие улучшения. Основа общественных и общих знаний (в Интернете). Всесторонний (Т.е. доказанный проанализировать...

ruby nokogiri html-parsing hpricot

вопрос задан: 2 March 2013 09:13

2

ответа

Запись синтаксического анализатора HTML в Erlang

Я очень плохо знаком с Erlang и как часть моего приобретения знаний осуществления, я хотел бы записать синтаксический анализатор HTML в Erlang. Я хочу извлечь определенные значения из веб-страницы, возможно, с помощью шаблона для описания что...

erlang html-parsing

вопрос задан: 22 May 2012 22:48

2

ответа

как использовать dom php синтаксический анализатор

Я плохо знаком с DOM, анализирующим в PHP: у Меня есть файл HTML, который я пытаюсь проанализировать. Это имеет набор ОТДЕЛЕНИЙ как это: <идентификатор отделения = "interestingbox"> <идентификатор отделения = "interestingdetails&qu

php dom html-parsing

вопрос задан: 22 February 2011 16:17

2

ответа

Проверка HTML представляет в виде строки для нераскрытых тегов

У меня есть строка как источник HTML, и я хочу проверить, содержит ли источник HTML, который является строкой, тег, который не открыт. Например, строка ниже содержит </u> после ФОРМЫ СИГНАЛА который...

c# .net html-parsing

вопрос задан: 2 July 2010 10:42

2

ответа

Как проанализировать HTML для минификации в PHP?

Я надеюсь писать алгоритм для сжатия вывода HTML для CMS, который я пишу в PHP, записанном с платформой CodeIgniter. Я думал о попытке удалить пробел между любым углом...

php html codeigniter html-parsing

вопрос задан: 30 June 2010 16:36

2

ответа

PHP парсинг недопустимого HTML

я пытаюсь проанализировать некоторый HTML, который не находится на моем $dom сервера = новый DOMDocument (); $dom-> loadHTMLfile ("http://www.some-site.org/page.aspx"); $dom-эха> getElementById ('his_id'...

php html-parsing domdocument

вопрос задан: 24 April 2010 01:11

2

ответа

Синтаксический анализатор HTML для GAE

Обычно я использую lxml для своих потребностей парсинга HTML, но это не доступно на Google App Engine. Очевидной альтернативой является BeautifulSoup, но я нахожу, что это дросселирует слишком легко на уродливом HTML. В настоящее время я...

python google-app-engine html-parsing lxml

вопрос задан: 29 January 2010 11:29

2

ответа

Парсинг HTML для получения довольным использование C#

Я пишу приложение, которое проверяет группу моих веб-страниц. Вместо того, чтобы брать весь исходный код страницы, я хотел бы взять все содержание и хранилище это и быть в состоянии сохранить страницу как...

c# string html-parsing

вопрос задан: 10 January 2010 18:49

2

ответа

BeautifulSoup - простой способ к получить содержание без HTML

Я использую этот код для нахождения всех интересных ссылок на странице: soup.findAll (href=re.compile ('^notizia.php \? idn =\d + ')), И это делает свое задание вполне прилично. К сожалению, в этом тег там...

python beautifulsoup html-parsing html-content-extraction

вопрос задан: 28 December 2009 16:02

1

ответ

Попытка очистить страницу одним cookie

Я пытаюсь очистить таблицу от URL. Я уже некоторое время пользуюсь библиотекой запросов вместе с красивым супом, но я не хочу рисковать, используя веб-драйвер, как я уже ...

cookies web-scraping beautifulsoup python-requests html-parsing

вопрос задан: 24 January 2019 05:51

1

ответ

Очистите несколько абзацев в соответствии с определенной схемой

На этом веб-сайте газеты отдельные пункты этой статьи перечислены в отдельном теге объекты, в которых каждый < class > Имя атрибута начинается со слова article. Как я могу получить все параграфы, где ...

r xpath web-scraping html-parsing rvest

вопрос задан: 19 January 2019 22:07

1

ответ

Как разобрать вложенную таблицу из ссылки HTML, используя BeautifulSoup в Python?

Все, я пытаюсь разобрать таблицу по этой ссылке http://web1.ncaa.org/stats/StatsSrv/careersearch. Обратите внимание: для поиска в разделе «Поиск школы / спорта» выберите «Все для школы», «Год 2005-2006», «Спорт» ...

python-3.x pandas beautifulsoup html-parsing html-parser

вопрос задан: 19 January 2019 03:09

1

ответ

Почему я не могу очистить весь контент в атрибуте data-src этого HTML

Я пытаюсь очистить все данные внутри элемента «data-src» этого HTML-текста: [< div class = "js-delayed-image-load" data-alt = "Человек закрывает лицо во время песчаной бури в Каир, Египет, 16 ...

python-3.x web-scraping beautifulsoup html-parsing

вопрос задан: 18 January 2019 10:08

1

ответ

Рендеринг нескольких экземпляров в Handlebars + Express + Nodejs

Пожалуйста, помогите мне со следующим: как визуализировать несколько экземпляров, которые поступают из базы данных anyd (в моем случае из хранилища данных Gcloud, до того, как это было MongoDB, но это на самом деле не имеет значения), как я ...

templating-engine express-handlebars node.js html-parsing rendering

вопрос задан: 18 January 2019 09:37

1

ответ

Простой HTML DOM не может получить первый TD в TR

У меня проблемы с анализом таблицы с помощью PHP Simple HTML DOM Parser 1.81 от SourceForge. У меня есть PHP 7.1. Я сделал этот тест, чтобы объяснить мою проблему. У меня есть этот HTML-файл test.html: <! DOCTYPE html & ...

html-parsing parsing

вопрос задан: 17 January 2019 17:42

1

ответ

Как получить переменные тега скрипта с веб-сайта с использованием Python

Я пытаюсь вытащить переменную с именем meta в тег скрипта, используя Python. Я использовал селен, чтобы сделать это раньше, но селен слишком медленный для того, что я пытаюсь достичь. Есть ли другой способ ...

python web-scraping beautifulsoup html-parsing

вопрос задан: 17 January 2019 15:44

1

ответ

Парсинг HTML-таблицы BeautifulSoup

Я пытаюсь проанализировать информацию (таблицы HTML) от этого сайта: http://www.511virginia.org/RoadConditions.aspx?j=All&r=1 В настоящее время, я использую BeautifulSoup и код, который я имею, похож на это...

python beautifulsoup html-table html-parsing mechanize

вопрос задан: 19 February 2017 22:47

1

ответ

Регулярное выражение выделяет весь текст между тегами

Как лучше всего выделить весь текст между двумя тегами - например: текст между всеми «предварительными» тегами на странице.

regex html html-parsing

вопрос задан: 11 November 2015 19:00

1

ответ

DOMDocument в php

Я только что начал читать документацию и примеры по DOM, чтобы сканировать и анализировать документ. Например, у меня есть часть документа, показанного ниже:

<...

php xml-parsing html-parsing domdocument

вопрос задан: 1 July 2014 15:03

1

ответ

как распечатать ячейки таблицы с простым HTML dom

у меня есть этот HTML-код. Я использую Простой HTML Dom для парсинга данных в мой собственный сценарий PHP. <таблица> <TR> <td класс = "заголовок"> Имя </td> <td класс = "заголовок" и...

php html-parsing simple-html-dom

вопрос задан: 11 April 2012 11:43

1

ответ

HTML-теги Agility Pack НЕ ВХОДЯТ в белый список

Я пытаюсь создать функцию, которая удаляет HTML-теги и атрибуты, которых нет в белом списке. У меня есть следующий HTML-код: < b > первый текст < / b > < b > второй текст здесь < ...

c# tags html-parsing html-agility-pack sanitize

вопрос задан: 4 April 2012 19:18

1

ответ

PowerShell - анализ HTML: получение информации с веб-сайта

Обновление, сценарий работает с PowerShell V3.0, спасибо @ Doug. Я хочу использовать следующий сценарий PowerShell для получения информации о статусе рейса от Lufthansa. Я могу видеть информацию о статусе рейса в обновлении ...

powershell html-parsing

вопрос задан: 30 January 2012 14:19

1

ответ

Простой пример парсинга libxml2 HTML, с помощью Цели-c, XCode и HTMLparser.h

Может кто-то показывать мне простой пример парсинга некоторого HTML с помощью libxml. #import <libxml2/libxml/HTMLparser.h> NSString *HTML = "<ул.>" "<литий> <входной тип = \"отображает \"...

objective-c xcode html-parsing libxml2

вопрос задан: 6 June 2011 12:59