Мне нужно извлечь часть HTML из заданной HTML-страницы. Пока я использую XmlSlurper с tagoup для анализа HTML-страницы, а затем пытаюсь получить нужную часть с помощью StreamingMarkupBuilder:
import groovy.xml.StreamingMarkupBuilder
def html = "<html><body>a <b>test</b></body></html>"
def dom = new XmlSlurper(new org.ccil.cowan.tagsoup.Parser()).parseText(html)
println new StreamingMarkupBuilder().bindNode(dom.body)
Однако результат, который я получаю, -
<html:body xmlns:html='http://www.w3.org/1999/xhtml'>a <html:b>test</html:b></html:body>
, что выглядит великолепно, но я хотел бы получить это без пространства имен html.
Как мне избежать пространства имен?