Преобразуйте .odt .doc .ods файлы в .txt файлы

Нет никакой официальной документации относительно этого. Однако при рассмотрении исходного кода JavaScript, Вы будете видеть это:

function WebForm_PostBackOptions(eventTarget, eventArgument, validation, validationGroup, actionUrl, trackFocus, clientSubmit)

я думаю, что названия параметра довольно очевидны.

15
задан fifi finance 28 October 2018 в 08:46
поделиться

6 ответов

Для документов Word вы можете попробовать antiword , по крайней мере, в Linux. Это утилита командной строки, которая принимает текстовый документ в качестве аргумента и выводит текст из этого документа (насколько это возможно) в стандартный вывод. Возможно, вы также можете указать выходной файл. Я не могу вспомнить, как это работает. Давно не пользовался. Не уверен, что он может обрабатывать ОО-документы.

1
ответ дан 1 December 2019 в 01:17
поделиться

Конечно, можно сделать это, хотя есть что-то странное и непонятное в ОО-проекте и его документации, из-за чего такие вещи сложно исследовать и следовать. Тем не менее, объектно-ориентированный объект может преобразовывать все эти типы, а не только оригинальные объектно-ориентированные типы, и может делать это с помощью двух различных форм автоматического управления.

Это два общих подхода.

  1. Вы можете запустить объектно-ориентированный объект. и скажите ему выполнить макрос, который сделает эту работу за вас для данного файла. Затем вам просто нужно написать макрос и сценарий для циклического просмотра ваших файлов. Синтаксис выглядит примерно так:

    $ oowriter -headless filename macro: //dir/Standard.Module1. sMySub

  2. Еще одна вещь, которую имеет OO, - это сетевой API. Это основано на том, что называется UNO.

    $ oowriter -accept = accept-string

     Сообщает программе OpenOffice.org, что при создании
    «UNO Acceptor Threads», будет использоваться «UNO Accept String».
    

Вам понадобится какая-то клиентская библиотека. Я думаю, что у них есть хотя бы один для Python. Используя эту технологию, программа Python или какой-либо другой язык сценариев с клиентской библиотекой OO может управлять программой и преобразовывать все файлы. Поскольку объектно-ориентированный объект читает MSO, он должен иметь возможность выполнять их все.

1
ответ дан 1 December 2019 в 01:17
поделиться

OpenOffice имеет встроенный конвертер документов, способный обрабатывать множество форматов. Взгляните на unoconv: http://dag.wieers.com/home-made/unoconv /

При этом у меня были некоторые проблемы с тем, чтобы заставить это работать в прошлом. Если у вас возникнут проблемы, взгляните на аналогичные программы для AbiWord (другого текстового процессора с открытым исходным кодом).

2
ответ дан 1 December 2019 в 01:17
поделиться

Информацию о форматах Microsoft можно найти в инструментах wvWare .

0
ответ дан 1 December 2019 в 01:17
поделиться

Есть программа для файлов odt и им подобных:

odt2txt - доступна в репозиториях.

23
ответ дан 1 December 2019 в 01:17
поделиться
$ unoconv --format=txt document1.odt

Должен выдать файл document1.txt.

11
ответ дан 1 December 2019 в 01:17
поделиться
Другие вопросы по тегам:

Похожие вопросы: