0
ответов

HtmlAgilityPack установить узел InnerText

Я хочу заменить внутренний текст HTML-тегов другим текстом. Я использую HtmlAgilityPack. Я использую этот код для извлечения всех текстов. HtmlDocument doc = new HtmlDocument (); {{ 1}} doc.Load ("some path") foreach (...
вопрос задан: 25 November 2011 21:34
0
ответов

Как с помощью Python анализировать страницу с бесконечной прокруткой (например, Wallbase.cc/search/sky)?

Не уверен, есть ли что-нибудь с Mechanize или BeautifulSoup, что могло бы помощь. Любые предложения будут ценны!
вопрос задан: 16 November 2011 17:30
0
ответов

Android ImageGetter изображения перекрывают текст

Я пытаюсь загрузить блок HTML в TextView, включая изображения, с помощью URLImageParser p = new URLImageParser (articleBody, this); Spanned htmlSpan = Html. fromHtml (parsedString, p, null); ...
вопрос задан: 24 October 2011 00:28
0
ответов

Как сократить HTML с помощью Java?

Пользователь вводит текст в формате HTML в форме, например:

это мое сообщение в блоге , очень длинное и написано на HTML

Я ...
вопрос задан: 8 October 2011 13:27
0
ответов

Лучший модуль Python для синтаксического анализа HTML [закрыто]

У меня есть средство обновления веб-сайта (люди могут обновлять контент (текст), а не внешний вид веб-сайта), в котором есть HTML, javascript в качестве языков интерфейса и Python в качестве серверной части. Я обнаружил, что ...
вопрос задан: 4 October 2011 23:34
0
ответов

Выбор по «имени» в JSoup

У меня есть несколько div в URL-адресе веб-страницы, которые мне нужно проанализировать, которые имеют одинаковое имя класса, но разные имена без идентификаторов. для напр.
вопрос задан: 28 September 2011 19:18
0
ответов

Получение событий установки и удаления пакета

Я пытаюсь определить, когда устанавливается новое приложение, но только если оно запущено. Мне удалось обнаружить установку приложения, сделав BroadcastReceiver и активировав его внутри...
вопрос задан: 19 September 2011 11:46
0
ответов

Android HTML ImageGetter Asynctask

Хорошо, я теряю свой разум над этим. У меня есть метод в моей программе, которая анализирует HTML. Я хочу включить встроенные изображения, и я нахожусь под впечатлением, что используя HTML.FROMHTML (String, HTML ....
вопрос задан: 15 September 2011 00:16
0
ответов

Как разбираться на разметку через C # [Закрыто]

Я хочу разобрать документ Markdown и визуализацию его как отформатированные HTML, как я могу сделать это, пожалуйста? Должен ли я сделать это с нуля, или любая API может быть основана? так что спасибо.
вопрос задан: 5 September 2011 07:06
0
ответов

Очистка HTML в тексте из HtmlCleaner

Я хочу увидеть очищенный HTML, полученный из HTMLCleaner. Я вижу, что в TagNode есть метод сериализации, но не знаю, как его использовать. У кого-нибудь есть образец кода для этого? Спасибо ...
вопрос задан: 25 August 2011 19:03
0
ответов

Получить текст вне одного тега и внутри другого

Я анализирую веб-страницу с помощью BeautifulSoup, и на ней есть некоторые элементы, подобные следующим: Регистрационный номер консультанта:
вопрос задан: 25 August 2011 16:08
0
ответов

Написание HTML-парсера

В настоящее время я пытаюсь (или планирую попытаться) написать простую (насколько это возможно) программу для синтаксического анализа HTML-документа в дерево. После поиска в Google я нашел много ответов, в которых говорилось: «Не делай этого, это ...
вопрос задан: 25 August 2011 14:42
0
ответов

Как извлечь отдельные текстовые узлы с помощью Jsoup?

У меня есть такой элемент: TextA
TextB Как я могу извлекать TextA и TextB отдельно?
вопрос задан: 23 August 2011 16:44
0
ответов

Как удалить с веб-сайта только тег

Я работаю над поисковым роботом. В настоящий момент я очищаю весь контент, а затем, используя регулярное выражение, удаляю теги ,