Microsoft Windows - лучшая платформа для разработки программного обеспечения.
Обоснование: Microsoft портит своих разработчиков отличными и дешевыми инструментами разработки, платформа и ее API хорошо документированы, платформа развивается быстрыми темпами, что создает множество возможностей для разработчиков, ОС имеет большую базу пользователей, что важно по очевидным коммерческим причинам, есть большое сообщество разработчиков Windows, меня еще не уволили за выбор Microsoft.
Попробуйте HTML Tidy . Я слышал, что он довольно хорошо работает с HTML, созданным MS Word (определенно, по крайней мере, до Word 2000, но, вероятно, и с более поздними версиями).
На самом деле это не вопрос программирования, но (по крайней мере, последние версии) Word может сохранять на «Веб-страницу с фильтрами», которая удаляет специфичные для Office теги и свойства и оставляет только теги, необходимые для отображения документа в веб-браузере. Итак, если у вас есть Word, вы можете попробовать использовать его, чтобы открыть документ HTML и сохранить его в этом формате.
Вероятно, вы ищете HTML Tidy , у которого есть адаптеры практически для всех языков. В нем есть опции для очистки вывода HTML в Microsoft Word (и многие другие функции).