29
ответов

Варианты соскоба HTML? [закрыто]

Я подумываю попробовать Beautiful Soup, пакет Python для очистки HTML. Есть ли какие-либо другие пакеты для очистки HTML, на которые мне стоит обратить внимание? Python не является обязательным требованием, я на самом деле заинтересован в ...
вопрос задан: 31 August 2018 22:28
21
ответ

Можно ли обеспечить примеры парсинга HTML?

Как Вы анализируете HTML со множеством библиотек парсинга и языков? При ответе: Отдельные комментарии будут связаны с в ответах на вопросы о том, как проанализировать HTML с regexes как путь...
вопрос задан: 22 March 2013 20:24
10
ответов

Используя регулярные выражения для парсинга HTML: почему нет?

На каждый вопрос на stackoverflow походит, откуда автор вопроса использует regex для захвата некоторой информации HTML, будет неизбежно иметь "ответ", в котором говорится для не использования regex для парсинга HTML. Почему нет? Я...
вопрос задан: 12 May 2014 08:28
8
ответов

Какова лучшая практика для парсинга удаленного содержания с jQuery?

После jQuery ajax звонят для получения всего документа XHTML, что лучший способ состоит в том, чтобы выбрать определенные элементы из получившей строки? Возможно, существует библиотека или плагин, который решает это...
вопрос задан: 24 June 2009 02:25
7
ответов

Как вы анализируете и обрабатываете HTML / XML в PHP?

Как можно проанализировать HTML / XML и извлечь из него информацию?
вопрос задан: 15 April 2019 12:30
7
ответов

Что анализирует?

Парсинг - что-то, через что я приехал много в разработку, но как юниор ее из тех вещей, я предполагаю, что приобрету навык в какой-то момент, когда ее необходимое. В моем текущем проекте мне сказали...
вопрос задан: 11 June 2013 06:09
6
ответов

Доступ к элементам из HTML в JavaScript [дубликат]

У меня есть элемент в HTML с тегом div и id, мне нужно получить доступ к содержимому в файле JavaScript, который включен в HTML. Это в HTML var obj = document.getElementById ("x") ....
вопрос задан: 11 May 2016 22:29
6
ответов

Как найти/заменить текст в HTML при сохранении тегов/структуры HTML

Я использую regexps для преобразования текста, как я хочу, но я хочу сохранить HTML-тэги. например, если я хочу заменить "переполнение стека" "выходом за нижнюю границу стека", это должно работать как ожидалось: если вход является стек
вопрос задан: 6 December 2009 19:34
6
ответов

Java: у Меня есть большая строка HTML и потребности извлечь href = “…” текст

У меня есть эта строка, содержащая большой блок HTML, и пытаюсь извлечь ссылку из href = "..." часть строки. href мог быть в одной из следующих форм: <href = "..."/> и...
вопрос задан: 3 November 2009 23:05
6
ответов

Проблема с синтаксическим анализатором HTML в IE

Я пытаюсь создать диалоговое окно, которое появится, только если выбранный браузер является IE (любая версия) однако, я получаю эту ошибку: сообщение: Ошибка анализа HTML: Неспособный изменить родительский контейнер...
вопрос задан: 19 November 2008 20:31
5
ответов

Как извлечь img src, title и alt из html с помощью php? [Дубликат]

Я хотел бы создать страницу, где все изображения, которые находятся на моем сайте, перечислены с заголовком и альтернативным представлением. Я уже написал мне небольшую программу, чтобы найти и загрузить все файлы HTML, ...
вопрос задан: 27 May 2015 12:59
5
ответов

подобный jQuery интерфейс для PHP?

Мне было любопытно относительно того, существует ли там интерфейс/библиотека стиля jQuery для PHP для обработки HTML/XML-файлов - конкретно использование селекторов стиля jQuery. Я хотел бы сделать вещи как это (все...
вопрос задан: 18 February 2014 07:45
5
ответов

Данные извлечения из веб-сайта через PHP

Я пытаюсь создать простое аварийное приложение для некоторых друзей. В основном я хочу смочь извлечь данные "цена" и "доступность запаса" от веб-страницы как следующие два: http://www.sparkfun.com/...
вопрос задан: 5 June 2013 04:21
5
ответов

Как синтаксические анализы HTML работают, если они не используют regexp?

Я вижу вопросы каждый день, спрашивая, как проанализировать или извлечь что-то из некоторой строки HTML, и первый ответ/комментарий всегда, "Не используют RegEx для парсинга HTML, чтобы Вы не чувствуете гнев!" (это длится...
вопрос задан: 12 April 2012 16:08
5
ответов

Написание HTML-парсера

В настоящее время я пытаюсь (или планирую попытаться) написать простую (насколько это возможно) программу для синтаксического анализа HTML-документа в дерево. После поиска в Google я нашел много ответов, в которых говорилось: «Не делай этого, это ...
вопрос задан: 25 August 2011 14:42
5
ответов

Как проанализировать уродливый HTML в Python, пользуясь стандартными библиотеками

Существуют так многие HTML и xml библиотеки, встроенные в Python, что трудно полагать, что нет никакой поддержки реального парсинга HTML. Я нашел много больших сторонних библиотек для этой задачи...
вопрос задан: 21 April 2010 04:47
5
ответов

Как я могу найти содержание отделения, использующего модули HTML Perl, если я знаю тег в нем?

С тех пор, как я спросил, как проанализировать HTML с regex и колотился немного (законно так), я изучал HTML:: TreeBuilder, HTML:: Синтаксический анализатор, HTML:: TokeParser и HTML:: модули Perl Элементов. Я имею...
вопрос задан: 7 November 2009 12:13
5
ответов

Регулярное выражение PHP для удаления тегов в документе HTML

Скажите, что у меня есть следующий текст.. (содержание)............. <HREF = "http://foo.com/content"> и тому подобное </A>... (продолжают содержание)... Я хочу удалить ссылку, и я хочу удалить...
вопрос задан: 6 September 2009 06:42
5
ответов

Преимущества XSLT или Linq к XML

Какими преимуществами является там для использования или XSLT или Linq к XML для парсинга HTML в C#? Это находится под предположением, что HTML был убран так, это - допустимый xhtml. Эти значения будут в конечном счете...
вопрос задан: 1 July 2009 00:24
4
ответа

Как я могу убрать HTML-тэги из строки ColdFusion?

Я ищу быстрый способ проанализировать HTML-тэги из строки ColdFusion. Мы вытягиваем в канале RSS, который мог потенциально иметь что-либо в нем. Мы затем делаем некоторое управление...
вопрос задан: 15 July 2014 14:32
4
ответа

Как я могу достигнуть соответствия при использовании preg_replace в PHP?

Я пытаюсь захватить прописные буквы нескольких слов и перенести их в теги span. Я использую preg_replace для извлечения и переношу цели, но это ничего не производит. preg_replace (" / [A-...
вопрос задан: 29 July 2013 11:09
4
ответа

Парсинг HTML в Python - lxml или BeautifulSoup? Какой из них лучше для какой виды целей?

Из того, что я могу разобрать, две основных библиотеки парсинга HTML в Python являются lxml и BeautifulSoup. Я выбрал BeautifulSoup для проекта, я продолжаю работать, но я выбрал его ни по какой конкретной причине...
вопрос задан: 17 December 2009 04:08
4
ответа

Парсинг HTML в [закрытом] Python

Каков мой лучший выбор для парсинга HTML, если я не могу использовать BeautifulSoup или lxml? У меня есть некоторый код, который использует SGMLlib, но это - немного низкий уровень, и он теперь удерживается от использования. Я предпочел бы, если это могло
вопрос задан: 4 April 2009 18:11
4
ответа

Какой язык/инструмент я должен использовать для парсинга HTML?

У меня есть несколько веб-сайтов, что я хочу извлечь данные из и на основе предыдущего опыта, это не столь легко, как это звучит. Почему? Просто, потому что страницы HTML, которые я должен проанализировать, не правильно...
вопрос задан: 24 February 2009 14:25
3
ответа

Как захватить содержание HTML-тэгов?

Эй поэтому то, что я хочу сделать, поймать содержание для первого абзаца. Строковый $blog_post содержит много абзацев в следующем формате: <p> Абзац 1 </p> <p> Абзац 2 <...
вопрос задан: 5 June 2015 17:14
3
ответа

Как преобразовать документ, созданный в Jsoup (анализатор HTML html) в строку

У меня есть документ, который был сделан в jsoup, который выглядит как этот документ doc = Jsoup.connect ("http://en.wikipedia.org/") .get (); Как мне преобразовать этот документ в строку.
вопрос задан: 5 March 2015 11:51
3
ответа

Как делает синтаксический анализатор (например, HTML) работа?

Поскольку польза аргумента позволяет, принимают синтаксический анализатор HTML. Я считал, что это маркирует все сначала и затем анализирует его. Что действительно маркирует средний? Делает синтаксический анализатор, читает каждый символ каждый, растя...
вопрос задан: 21 July 2014 00:23
3
ответа

Какой Синтаксический анализатор HTML является лучшим? [закрытый]

Я кодирую много синтаксических анализаторов. Вплоть до сих пор я использовал HtmlUnit бездисплейный браузер для автоматизации браузера и парсинга. Теперь, я хочу разделить обоих задачи. Поскольку 80% моей работы включают просто парсинг, меня...
вопрос задан: 22 May 2014 07:17
3
ответа

Соответствие всему между HTML <тело> теги с помощью PHP

У меня есть сценарий, который возвращает следующее в переменной, названной $content <тело> <p> <класс промежутка = \"c-кв/см \",> dgdfgdf </промежуток> </p> </тело> я однако должен поместить...
вопрос задан: 24 December 2012 21:25
3
ответа

Получите представленный текст от HTML (Delphi)

У меня есть некоторый HTML, и я должен извлечь фактический записанный текст из страницы. До сих пор я попытался использовать веб-браузер и представить страницу, затем идя в свойство документа и захватив...
вопрос задан: 8 June 2010 21:49