Java -преобразование именованных объектов html в пронумерованные объекты xml

Я хочу преобразовать html-блок, содержащий именованные html-сущности, в xml-совместимый блок, который использует пронумерованные xml-сущности, оставив все элементы html-тегов на месте.

Это основная идея, проиллюстрированная тестом.:

@Test
public void testEvalHtmlEntitiesToXmlEntities() {
    String input = "<a href=\"test.html\">link&nbsp;</a>";
    String expected = "<a href=\"test.html\">link&#160;</a>";
    String actual = SomeUtil.eval(input);
    Assert.assertEquals(expected, actual);
}

Кто-нибудь знает о классе, обеспечивающем эту функциональность? Я могу написать регулярное выражение для перебора совпадений без элементов и выполнить :

xlmString += StringEscapeUtils.escapeXml(StringEscapeUtils.unescapeHtml(htmlString));

, но надеюсь, что есть более простой способ или класс, который уже обеспечивает это.

7
задан Dave Maple 3 May 2012 в 20:33
поделиться