Использование Python для извлечения изображений и текста из текстового документа

Я хотел бы запустить сценарий в папке, полной документов Word, который читает документы и вытаскивает изображения и их подписи (текст прямо под изображениями). Исходя из проведенного мной исследования, я думаю, что pywin32 может быть жизнеспособным решением. Я знаю, как использовать pywin32 для поиска строк и их извлечения, но мне нужна помощь с частью изображений. Как я могу прочитать файл docx и вызвать событие при обнаружении изображения? Спасибо за любую помощь! Я использую Python 2.7.

6
задан Preston Donovan 14 June 2011 в 14:29
поделиться