21
ответ

Защита от [закрытого] анализа экранных данных

Следование за моим вопросом на Законности анализа экранных данных, даже если это - недопустимые люди, все еще попробует, таким образом: Что технические механизмы могут использоваться для предотвращения или по крайней мере disincentivise...
вопрос задан: 23 May 2017 11:45
16
ответов

Как я предотвращаю очистку сайта? [закрытый]

У меня есть довольно большой музыкальный веб-сайт с большой базой данных художника. Я замечал другие музыкальные сайты, очищающие данные нашего сайта (я ввожу фиктивные Имена художника тут и там и затем гуглю поиски...
вопрос задан: 4 March 2014 09:22
12
ответов

Win32.: Как очистить HTML без регулярных выражений?

В недавней записи в блоге Jeff Atwood говорится, что Вы никогда не должны анализировать HTML с помощью регулярных выражений - все же не дает альтернативу. Я хочу очистить поисковые результаты поиска, извлекая значения: <...
вопрос задан: 21 October 2018 10:27
12
ответов

Каков лучший язык анализа экранных данных? [закрытый]

Привет я хочу создать настольное приложение (c# prob), который очищает или управляет формой на сторонней веб-странице. В основном я ввожу свои данные в форму в настольном приложении, это уходит к стороннему веб-сайту...
вопрос задан: 5 December 2011 11:06
11
ответов

Экранный скребок поблочного тестирования

Я нахожусь в процессе записи скребка экрана HTML. Каков был бы лучший способ создать модульные тесты на это? Это "в порядке", чтобы иметь статический файл HTML и считать его из диска на каждом тесте? Вы имеете...
вопрос задан: 3 April 2015 15:05
11
ответов

Программно обнаруживающее “самое важное содержание” на странице

Какая работа, если таковые имеются, была сделана для автоматического определения самых важных данных в рамках документа HTML? Как пример, думайте о своем стандарте news/blog/magazine-style веб-сайт, содержа...
вопрос задан: 18 June 2009 22:17
9
ответов

Как экранные скребки работают? [закрытый]

Я слышу, что люди пишут эти программы все время, и я знаю то, что они делают, но как они на самом деле делают это? Я ищу общие понятия.
вопрос задан: 10 November 2010 09:42
9
ответов

Как я могу экранировать царапанье с Perl?

Я должен отобразить некоторые значения, которые хранятся в веб-сайте, для этого я должен очистить веб-сайт и выбрать содержание от таблицы. Какие-либо идеи?
вопрос задан: 3 April 2009 21:41
9
ответов

Сверхбыстрые методы анализа экранных данных? [закрытый]

Я часто должен, чтобы сделать некоторый простой анализ экранных данных во внутренних целях (т.е. сторонний сервис, который я использую, только публикует отчеты через HTML). У меня есть по крайней мере два или три случая этого теперь...
вопрос задан: 26 February 2009 08:30
8
ответов

Очистите динамический веб-сайт

Что лучший метод должен очистить динамический веб-сайт, где большая часть содержания сгенерирована тем, что, кажется, запросы ajax? У меня есть предыдущий опыт с Механизированием, BeautifulSoup и Python...
вопрос задан: 16 October 2008 00:16
8
ответов

Есть ли PHP-эквивалент WWW :: Mechanize в Perl?

Я ищу библиотеку, которая имеет функциональность, аналогичную Perl WWW :: Mechanize, но для PHP. По сути, это должно позволить мне отправлять HTTP-запросы GET и POST с простым синтаксисом, а затем анализировать ...
вопрос задан: 13 October 2008 23:34
7
ответов

Регулярное выражение Python для HTML, анализирующего (BeautifulSoup)

Я хочу захватить значение скрытого поля ввода в HTML. <входной тип = "скрытое" имя = "fooId" оценивает = "12-3456789-1111111111"/>, я хочу записать регулярное выражение в Python, который возвратится...
вопрос задан: 16 December 2017 23:06
7
ответов

Очистка и парсинг страницы Википедии

Я задаюсь вопросом, существуют ли какие-либо существующие библиотеки в или доступны от Objective C, который позволил бы мне очищать страницы, отформатированные как этот. А именно, все даты и весь текст затем...
вопрос задан: 26 October 2015 14:00
7
ответов

Как я могу препятствовать тому, чтобы мой сайт asp.net был очищенным экраном? [закрытый]

Как я могу предотвратить свой asp.net 3,5 веб-сайта от того, чтобы быть экраном, очищенным моим конкурентом? Идеально, я хочу удостовериться, что никакой webbots или screenscrapers не могут извлечь данные из моего веб-сайта. Есть ли путь к...
вопрос задан: 24 April 2010 17:26
7
ответов

Что лучший способ состоит в том, чтобы записать удобному в сопровождении веб-приложению очистки?

Я записал сценарий жемчуга только что, который вошел в мой онлайн - банкинг и посылал мне по электронной почте мой баланс и мини-оператор каждый день. Я нашел это очень полезным для того, чтобы отслеживать мои финансы. Единственное...
вопрос задан: 28 December 2009 16:34
7
ответов

Анализ экранных данных: регулярные выражения или выражения XQuery?

Я отвечал на некоторые вопросы теста для интервью, и вопрос был о том, как я сделаю анализ экранных данных. Таким образом, выбор содержания из веб-страницы, принятие Вас не имеют лучшего...
вопрос задан: 3 April 2009 22:03
7
ответов

Алгоритмы, распознающие физический адрес на веб-странице

Каковы лучшие алгоритмы для распознавания структурированных данных на странице HTML? Например, Google распознает адрес дома/компании в электронном письме и предлагает карту этому адресу.
вопрос задан: 28 January 2009 00:12
7
ответов

Библиотека селектора CSS PHP? [закрытый]

Существует ли класс/библиотека PHP, который позволил бы мне запрашивать документ XHTML с селекторами CSS? Я должен очистить некоторые страницы для данных, которые очень легкодоступны, если я мог бы так или иначе использовать селекторы CSS...
вопрос задан: 21 January 2009 21:16
7
ответов

Как я могу очистить HTML-таблицу к CSV?

Проблема я использую инструмент на работе, которая позволяет мне сделать запросы и возвратить HTML-таблицы информации. У меня нет вида доступа бэкенда к нему. Много этой информации было бы намного более полезным, если я мог...
вопрос задан: 4 November 2008 02:10
7
ответов

Как реализовать веб-скребок в PHP? [закрытый]

Какие встроенные функции PHP полезны для веб-очистки? Каковы некоторые хорошие ресурсы (сеть или печать) для того, чтобы набрать скорость на веб-выскабливании PHP?
вопрос задан: 28 August 2008 20:11
6
ответов

Очистка HTML в Php [дубликат]

Я делал некоторую очистку HTML в PHP, использующем регулярные выражения. Это работает, но результат является привередливым и хрупким. Кто-либо использовал какие-либо пакеты, которые предоставляют больше надежного решения? Конфигурация...
вопрос задан: 18 January 2019 11:06
6
ответов

Извлечение текста от Java HTML

Я работаю над программой, которая загружает страницы HTML и затем выбирает часть информации, и запишите это в другой файл. Я хочу извлечь информацию, которая является intbetween теги абзаца, но...
вопрос задан: 12 March 2013 15:05
6
ответов

WebBrowsing в C# - Библиотеки, Инструменты и т.д. - чему-нибудь нравится, Механизируют в Perl? [закрытый]

Поиск чего-то подобного для Механизации для.NET... Если Вы не знаете то, что Механизирует.. http://search.cpan.org/dist/WWW-Mechanize/ я буду вести список предложений здесь. Что-либо для...
вопрос задан: 3 December 2010 16:52
6
ответов

Анализ экранных данных: обходя “Ошибку HTTP 403: запрос запрещен robots.txt”

Существует ли способ обойти следующее? httperror_seek_wrapper: Ошибка HTTP 403: запрос, запрещенный robots.txt, Является единственным путем вокруг этого для контакта с владельцем сайта (barnesandnoble.com).. я...
вопрос задан: 17 May 2010 00:35
6
ответов

Анализ экранных данных от веб-страницы с большим количеством [закрытого] JavaScript

Меня попросили записать приложение, которые скрывают информацию о царапанье от веб-страницы интранет, и представляет определенную информацию от него в хорошем легком для просмотра формата. Веб-страница является реальной путаницей и требует...
вопрос задан: 11 August 2009 23:02
6
ответов

Обеспечение API помогает, удержит анализ экранных данных?

Я думал вполне немного здесь в последнее время об анализе экранных данных и каково задача это может быть. Таким образом, я ставлю следующий вопрос. Как застройщик сайта выставляют простые API для предотвращения пользователей от...
вопрос задан: 24 May 2009 23:07
5
ответов

Как я могу использовать Perl для захвата текста от веб-страницы, которая динамично сгенерирована с JavaScript?

Существует веб-сайт, от которого я пытаюсь вытянуть информацию в Perl, однако раздел страницы, в которой я нуждаюсь, сгенерирован с помощью JavaScript так все, что Вы видите в источнике: <идентификатор отделения = "результаты"> и...
вопрос задан: 17 April 2010 13:42
5
ответов

Как знать, изменился ли очищаемый веб-сайт?

Я использую PHP, чтобы очистить веб-сайт и собрать некоторые данные. Это все обошлось без использования regex. Я использую php's, взрывают () метод для нахождения конкретных HTML-тэгов вместо этого. Это возможно это если структура...
вопрос задан: 27 March 2010 17:52
5
ответов

Как Вы защитили бы базу данных ссылок от того, чтобы быть очищенным?

У меня есть большая база данных ссылок, которые все отсортированы в особенных методах и присоединены к другой информации, которая ценна (некоторым людям). В настоящее время моя установка (который, кажется, работает), просто...
вопрос задан: 22 March 2010 21:42
5
ответов

Анализ экранных данных с Python

Python имеет библиотеки анализа экранных данных той поддержкой JavaScript предложения? Я использовал pycurl для простых запросов HTML и HtmlUnit Java для более сложных запросов, требующих JavaScript...
вопрос задан: 3 February 2010 08:11