У меня был успех с помощью TagSoup & amp; XPath для анализа HTML.
http://home.ccil.org/~cowan/XML/tagsoup/