Я разбираюсь XML, возвращаемый с веб-сайта, но к сожалению, его слегка неработает. Я получаю xml, как:
<tag attrib="Buy two for £1" />
, который, я проинформирован, недействителен, потому что £
- это символ HTML, а не символ XML и определенно не может отображаться в атрибуте.
Что я могу сделать, чтобы исправить это, предполагая, что я не могу сказать веб-сайту, чтобы подчиняться правилам? Я рассматриваю возможность использования FilterInputStream
, чтобы отфильтровать данные по прибытии до того, как он попадет в Sax Parser, но это кажется сверху.