Перепроектируйте веб-страницу

Я хочу перепроектировать любую веб-страницу в логическое представление страницы. Например, если веб-страница имеет меню, то я хочу логическую структуру меню, возможно, в XML. Если веб-страница имеет статью, я хочу узел статьи XML, если она имеет заголовок для статьи, я хочу заголовок узел XML. В основном я хочу логическую форму веб-страницы без любого пользовательского интерфейса.

Эта логическая модель могла или быть объектами в коде или XML, это не имеет значения, важная часть - то, что это определило что все на средствах страницы.

6
задан Phil 30 May 2010 в 11:17
поделиться

2 ответа

Похоже, то, что вы хотите, требует, чтобы человек классифицировал содержимое страницы.

Это можно автоматизировать, однако это будет иметь ложные срабатывания и работать не во всех случаях.

Например, что если одна страница использует ul для меню, а другая - ячейки таблицы?

Вы хотите, чтобы это было сделано для одного сайта в частности или для любого сайта в Интернете?

3
ответ дан 17 December 2019 в 18:10
поделиться

Как насчет синтаксического анализа XML, уже находящегося на странице, см.

http://en.wikipedia.org/wiki/XHTML

0
ответ дан 17 December 2019 в 18:10
поделиться
Другие вопросы по тегам:

Похожие вопросы: