3
ответа

Странное поведение CSS … удаление границы на 1 пкс заставляет <DIV> переместиться 20 пкс

У меня есть следующее: CSS #pageBody {высота: 500 пкс; padding:0; margin:0;/*border: твердый # 00ff00 на 1 пкс; */} #pageContent {height:460px; поле-left:35px; поле-right:...
вопрос задан: 31 May 2010 12:30
2
ответа

Реализация универсального веб-скребка с использованием Node.js

Я хотел бы реализовать базовый веб-скребок, используя Node.js, который является настолько универсальным, насколько это возможно. Я хочу, чтобы приложение могло анализировать и возвращать текст из любого HTML, игнорируя любую разметку / CSS / ...
вопрос задан: 15 January 2019 15:29
2
ответа

Анализ HTML из GMail с помощью скриптов приложений

Я хочу создать скрипт, который будет получать электронную почту с ее необработанным HTML, проанализировать HTML с помощью службы XML и вытащить различные биты данных. Моя проблема в том, что, когда вы тянете через HTML, используя ...
вопрос задан: 13 July 2018 16:35
2
ответа

Пакет Гибкости HTML - таблицы синтаксического анализа

Я хочу использовать пакет гибкости HTML для таблиц синтаксического анализа от сложных веб-страниц, но я так или иначе потерян в объектной модели. Я посмотрел на пример ссылки, но не нашел данные таблицы этим путем. Могу я...
вопрос задан: 12 January 2016 16:38
2
ответа

Как я преобразовываю строку в UTF-8 в Android?

Я использую синтаксический анализатор HTML под названием Jsoup, чтобы загрузить и проанализировать файлы HTML. Проблема состоит в том, что веб-страница, которую я очищаю, кодируется в наборе символов ISO-8859-1, в то время как Android использует кодировку
вопрос задан: 7 April 2015 16:36
2
ответа

Как я могу удалить атрибуты из HTML-тега?

Как я могу использовать php для удаления всех / любых атрибутов из тега, скажем, тега абзаца?

в

вопрос задан: 16 May 2014 20:02
2
ответа

Python потребности lxml справка синтаксиса для парсинга HTML

Я являюсь совершенно новым к Python, и я нуждаюсь в некоторой помощи с синтаксисом для нахождения и итерации через теги HTML с помощью lxml. Вот примеры использования, с которыми я имею дело: файл HTML довольно хорошо формируется (но...
вопрос задан: 27 May 2013 08:58
2
ответа

Nokogiri по сравнению с Hpricot?

Какой Вы выбрали бы? Мои важные атрибуты (не в порядке): Поддержка и будущие улучшения. Основа общественных и общих знаний (в Интернете). Всесторонний (Т.е. доказанный проанализировать...
вопрос задан: 2 March 2013 09:13
2
ответа

Запись синтаксического анализатора HTML в Erlang

Я очень плохо знаком с Erlang и как часть моего приобретения знаний осуществления, я хотел бы записать синтаксический анализатор HTML в Erlang. Я хочу извлечь определенные значения из веб-страницы, возможно, с помощью шаблона для описания что...
вопрос задан: 22 May 2012 22:48
2
ответа

как использовать dom php синтаксический анализатор

Я плохо знаком с DOM, анализирующим в PHP: у Меня есть файл HTML, который я пытаюсь проанализировать. Это имеет набор ОТДЕЛЕНИЙ как это: <идентификатор отделения = "interestingbox"> <идентификатор отделения = "interestingdetails&qu
вопрос задан: 22 February 2011 16:17
2
ответа

Проверка HTML представляет в виде строки для нераскрытых тегов

У меня есть строка как источник HTML, и я хочу проверить, содержит ли источник HTML, который является строкой, тег, который не открыт. Например, строка ниже содержит </u> после ФОРМЫ СИГНАЛА который...
вопрос задан: 2 July 2010 10:42
2
ответа

Как проанализировать HTML для минификации в PHP?

Я надеюсь писать алгоритм для сжатия вывода HTML для CMS, который я пишу в PHP, записанном с платформой CodeIgniter. Я думал о попытке удалить пробел между любым углом...
вопрос задан: 30 June 2010 16:36
2
ответа

PHP парсинг недопустимого HTML

я пытаюсь проанализировать некоторый HTML, который не находится на моем $dom сервера = новый DOMDocument (); $dom-> loadHTMLfile ("http://www.some-site.org/page.aspx"); $dom-эха> getElementById ('his_id'...
вопрос задан: 24 April 2010 01:11
2
ответа

Синтаксический анализатор HTML для GAE

Обычно я использую lxml для своих потребностей парсинга HTML, но это не доступно на Google App Engine. Очевидной альтернативой является BeautifulSoup, но я нахожу, что это дросселирует слишком легко на уродливом HTML. В настоящее время я...
вопрос задан: 29 January 2010 11:29
2
ответа

Парсинг HTML для получения довольным использование C#

Я пишу приложение, которое проверяет группу моих веб-страниц. Вместо того, чтобы брать весь исходный код страницы, я хотел бы взять все содержание и хранилище это и быть в состоянии сохранить страницу как...
вопрос задан: 10 January 2010 18:49
2
ответа

BeautifulSoup - простой способ к получить содержание без HTML

Я использую этот код для нахождения всех интересных ссылок на странице: soup.findAll (href=re.compile ('^notizia.php \? idn =\d + ')), И это делает свое задание вполне прилично. К сожалению, в этом тег там...
вопрос задан: 28 December 2009 16:02
1
ответ

Попытка очистить страницу одним cookie

Я пытаюсь очистить таблицу от URL. Я уже некоторое время пользуюсь библиотекой запросов вместе с красивым супом, но я не хочу рисковать, используя веб-драйвер, как я уже ...
вопрос задан: 24 January 2019 05:51
1
ответ

Очистите несколько абзацев в соответствии с определенной схемой

На этом веб-сайте газеты отдельные пункты этой статьи перечислены в отдельном теге объекты, в которых каждый < class > Имя атрибута начинается со слова article. Как я могу получить все параграфы, где ...
вопрос задан: 19 January 2019 22:07
1
ответ

Как разобрать вложенную таблицу из ссылки HTML, используя BeautifulSoup в Python?

Все, я пытаюсь разобрать таблицу по этой ссылке http://web1.ncaa.org/stats/StatsSrv/careersearch. Обратите внимание: для поиска в разделе «Поиск школы / спорта» выберите «Все для школы», «Год 2005-2006», «Спорт» ...
вопрос задан: 19 January 2019 03:09
1
ответ

Почему я не могу очистить весь контент в атрибуте data-src этого HTML

Я пытаюсь очистить все данные внутри элемента «data-src» этого HTML-текста: [< div class = "js-delayed-image-load" data-alt = "Человек закрывает лицо во время песчаной бури в Каир, Египет, 16 ...
вопрос задан: 18 January 2019 10:08
1
ответ

Рендеринг нескольких экземпляров в Handlebars + Express + Nodejs

Пожалуйста, помогите мне со следующим: как визуализировать несколько экземпляров, которые поступают из базы данных anyd (в моем случае из хранилища данных Gcloud, до того, как это было MongoDB, но это на самом деле не имеет значения), как я ...
вопрос задан: 18 January 2019 09:37
1
ответ

Простой HTML DOM не может получить первый TD в TR

У меня проблемы с анализом таблицы с помощью PHP Simple HTML DOM Parser 1.81 от SourceForge. У меня есть PHP 7.1. Я сделал этот тест, чтобы объяснить мою проблему. У меня есть этот HTML-файл test.html: <! DOCTYPE html & ...
вопрос задан: 17 January 2019 17:42
1
ответ

Как получить переменные тега скрипта с веб-сайта с использованием Python

Я пытаюсь вытащить переменную с именем meta в тег скрипта, используя Python. Я использовал селен, чтобы сделать это раньше, но селен слишком медленный для того, что я пытаюсь достичь. Есть ли другой способ ...
вопрос задан: 17 January 2019 15:44
1
ответ

Парсинг HTML-таблицы BeautifulSoup

Я пытаюсь проанализировать информацию (таблицы HTML) от этого сайта: http://www.511virginia.org/RoadConditions.aspx?j=All&r=1 В настоящее время, я использую BeautifulSoup и код, который я имею, похож на это...
вопрос задан: 19 February 2017 22:47
1
ответ

Регулярное выражение выделяет весь текст между тегами

Как лучше всего выделить весь текст между двумя тегами - например: текст между всеми «предварительными» тегами на странице.
вопрос задан: 11 November 2015 19:00
1
ответ

DOMDocument в php

Я только что начал читать документацию и примеры по DOM, чтобы сканировать и анализировать документ. Например, у меня есть часть документа, показанного ниже:
<...
вопрос задан: 1 July 2014 15:03
1
ответ

как распечатать ячейки таблицы с простым HTML dom

у меня есть этот HTML-код. Я использую Простой HTML Dom для парсинга данных в мой собственный сценарий PHP. <таблица> <TR> <td класс = "заголовок"> Имя </td> <td класс = "заголовок" и...
вопрос задан: 11 April 2012 11:43
1
ответ

HTML-теги Agility Pack НЕ ВХОДЯТ в белый список

Я пытаюсь создать функцию, которая удаляет HTML-теги и атрибуты, которых нет в белом списке. У меня есть следующий HTML-код: < b > первый текст < / b > < b > второй текст здесь < ...
вопрос задан: 4 April 2012 19:18
1
ответ

PowerShell - анализ HTML: получение информации с веб-сайта

Обновление, сценарий работает с PowerShell V3.0, спасибо @ Doug. Я хочу использовать следующий сценарий PowerShell для получения информации о статусе рейса от Lufthansa. Я могу видеть информацию о статусе рейса в обновлении ...
вопрос задан: 30 January 2012 14:19
1
ответ

Простой пример парсинга libxml2 HTML, с помощью Цели-c, XCode и HTMLparser.h

Может кто-то показывать мне простой пример парсинга некоторого HTML с помощью libxml. #import <libxml2/libxml/HTMLparser.h> NSString *HTML = "<ул.>" "<литий> <входной тип = \"отображает \"...
вопрос задан: 6 June 2011 12:59