Преобразовать слово (.docx) в docbook

Мне поручили найти способ конвертировать большое количество файлов .docx в docbook 5. В настоящее время мы открываем файл в openoffice и сохраняем в docbook . Это трудоемкая задача, но я уверен, что есть способ лучше. Затем эти файлы будут обрабатываться в нашей настраиваемой схеме Relax NG. Следовательно, это преобразование не обязательно должно быть безупречным. Я осмотрелся и продолжу исследовать некоторые зацепки, но не нашел ничего полезного.

смотрит на Конвертировать doc / docx в семантический HTML , они предложили upCast , но это не кажется мне подходящим для моих нужд.

Я ищу что-нибудь в свободном доступе, которое я могу использовать из командной строки. В конечном итоге я хотел бы обрабатывать наши файлы пакетным способом. Я включил теги linux, python и java, поскольку это среда, которая мне наиболее удобна, но я хотел бы найти правильное решение. Я пытаюсь провести небольшое исследование, прежде чем пойду изобретать велосипед.

8
задан Community 23 May 2017 в 12:34
поделиться