Как преобразовать веб-страницу (из внутренней вики) в документ Office?

У меня есть набор страниц Wiki (в стиле MediaWiki) во внутренней сети моей компании, которые я хотел бы преобразовать в документы Microsoft Office Word (или что-то, что я могу импортировать в него).Я ищу что-то, что имеет:

Требования

  • Сохраняйте форматирование настолько, насколько это возможно
  • Не требует каких-либо изменений на сервере, на котором размещена Wiki (нельзя добавлять ни плагины, ни файлы конфигурации изменено с моей стороны)
  • Решение может быть программным (так как я тоже разработчик), в духе Python/C#/C++ и т.п.

Исключения

  • Не похоже на решение как «Вики в Acrobat PDF Pro в Microsoft Office Word» (поскольку у нас нет Acrobat PDF Pro). На самом деле, даже непрофессиональная версия (с возможностью «Сохранить как Microsoft Word онлайн») недоступна в моей компании (очень старая версия пакета Adobe). Тем не менее, я все еще могу экспортировать страницу в формате pdf, но из имеющейся у нас Wiki она выглядит не очень хорошо (потому что некоторые элементы слишком велики для формата A4, а лишние части вырезаются из созданного pdf). хотел бы, чтобы они все равно были включены и в конечном итоге имели возможность играть с «плохим» форматированием в Word
  • Поскольку это вики-сайт для интрасети, онлайн-решения выходят за рамки
  • Решения, подразумевающие, что я могу скопировать базу данных из Wiki и выполнение операции в другом месте (например, дома) также не рассматриваются

Варианты

  • Решение может быть как в Windows, так и в Linux (CentOS)
  • Если оно может выполнять это в пакетном режиме, это лучше, но не обязательно

Вопрос

Не могли бы вы подсказать решение, которое могло бы удовлетворить мои потребности?

5
задан Alexis Pigeon 14 September 2012 в 15:10
поделиться