Помогите анализатору Java Sax понять плохой XML

Я разбираюсь XML, возвращаемый с веб-сайта, но к сожалению, его слегка неработает. Я получаю xml, как:

<tag attrib="Buy two for &pound;1" />

, который, я проинформирован, недействителен, потому что £ - это символ HTML, а не символ XML и определенно не может отображаться в атрибуте.

Что я могу сделать, чтобы исправить это, предполагая, что я не могу сказать веб-сайту, чтобы подчиняться правилам? Я рассматриваю возможность использования FilterInputStream , чтобы отфильтровать данные по прибытии до того, как он попадет в Sax Parser, но это кажется сверху.

5
задан Andrew Thompson 2 September 2011 в 16:39
поделиться