извлечение частей HTML с помощью groovy

Мне нужно извлечь часть HTML из заданной HTML-страницы. Пока я использую XmlSlurper с tagoup для анализа HTML-страницы, а затем пытаюсь получить нужную часть с помощью StreamingMarkupBuilder:

import groovy.xml.StreamingMarkupBuilder
def html = "<html><body>a <b>test</b></body></html>"
def dom = new XmlSlurper(new org.ccil.cowan.tagsoup.Parser()).parseText(html)
println    new StreamingMarkupBuilder().bindNode(dom.body)

Однако результат, который я получаю, -

<html:body xmlns:html='http://www.w3.org/1999/xhtml'>a <html:b>test</html:b></html:body>

, что выглядит великолепно, но я хотел бы получить это без пространства имен html.

Как мне избежать пространства имен?

6
задан rdmueller 25 April 2011 в 15:55
поделиться