Как проверить HTML из Java?

Какой быстрый и простой способ проверить HTML из Java? Я ищу класс с открытым исходным кодом / PD (или набор классов), который описывает различные свойства 100 с лишним тегов HTML, например:

  1. Является ли тег необязательным? Пусто? Законно ли опускать закрывающий тег?
  2. Какие еще теги может содержать этот тег (если есть)?
  3. Какие атрибуты допустимы для этого тега и каковы их типы? (не требуется, но приятно иметь)

Спасибо!

ИЗМЕНИТЬ

Я хочу провести анализ HTML-документа по тегам, поэтому я Я мог закодировать правила на основе спецификации W3C, но хотел посмотреть, какие готовые решения будут доступны в первую очередь.

13
задан Tony the Pony 8 December 2010 в 21:32
поделиться