Как преобразовать xml-файл, который не в формате UTF-8, в xml, совместимый с UTF-8

У меня есть огромный xml-файл, образец данных которого составляет :

 <vendor name="aglaia"><br>
              <vendorOUI oui="000B91" description="Aglaia Gesellschaft für Bildverarbeitung ud Kommunikation m" /><br>
         </vendor><br>
         <vendor name="ag"><br>
              <vendorOUI oui="0024A9" description="Ag Leader Technology" /><br>
         </vendor><br>

как видно, есть текст «Gesellschaft für Bildverarbeitung», который не совместим с UTF-8, потому что я получаю ошибки от валидатора xml, такие ошибки, как:

Import failed:
com.sun.org.apache.xerces.internal.impl.io.MalformedByteSequenceException: Invalid byte 1 of 1-byte UTF-8 sequence.

Итак, вопрос состоит в том, как решить эту проблему в среде Linux для преобразования XML-файла в формат, совместимый с UTF-8? или есть ли способ в bash, чтобы при создании xml в первую очередь я мог гарантировать, что все переменные / строки хранятся в формате, совместимом с UTF-8?

5
задан Joachim Sauer 14 June 2011 в 09:58
поделиться