С 6/2018 имя пакета yum
было обновлено с uwsgi-plugin-python
до uwsgi-plugin-python2
https://src.fedoraproject.org/rpms/uwsgi/pull-request/4#
Новая команда установки, следовательно, yum install uwsgi-plugin-python2
Этот класс может вам помочь. Я никогда не использовал его, но вот несколько ссылок:
They have probably written their own, maybe starting from wvWare or something similar. I have noticed that Google Desktop on Linux seems to use wvWare to parse MS Word documents.
The documentation for the Word file formats is available, but reading through it makes you realize that it would not be an easy task.
Automating Word or OpenOffice would be the easiest, but there might be licensing issues with using Word like that, and possible concurrency issues with using either of them on a web server.
Проект Apache POI (написанный на Java) предлагает интерфейс для многих типов файлов из пакета MS Office.
Вы можете запускать код Java из PHP, используя мост PHP / Java .
Я однажды использовал это для приложения, в котором документы MS Word нужно было индексировать в веб-приложении. Я помню, что настройка была довольно сложной задачей, но потом все работало очень хорошо и достаточно быстро. (К сожалению, код был написан на PHP4, и я не владею им, поэтому я не могу помочь вам с какими-либо фрагментами здесь.)
PS Я не могу публиковать ссылки, так как я новый пользователь, поэтому Google для "Apache POI »и« Мост PHP / Java », чтобы перейти на домашнюю страницу соответствующего проекта.
Популярным способом сделать это является создание RTF с расширением файла .doc. Он отлично работает с Word и другими редакторами, и пользователи по-прежнему довольны тем, что это «файл DOC»