Документ, rtf и txt читатель в Python

Как csv.reader() есть ли любые другие функции, которые могут читать .rtf, .txt, .doc файлы в Python?

11
задан sth 19 July 2010 в 16:53
поделиться

2 ответа

Вы можете прочитать текстовый файл с помощью

txt = open("file.txt").read()

Попробуйте PyRTF для файлов RTF. Я думаю, что чтение файлов MS Word .doc маловероятно, если вы не работаете в Windows и не можете использовать некоторые из собственных интерфейсов MS для чтения этих файлов. В этой статье утверждается, что показано, как писать сценарии, взаимодействующие с Word.

9
ответ дан 3 December 2019 в 05:33
поделиться

csv - это особый формат, поэтому вам понадобится «синтаксический анализатор» для его чтения. Это то, что предоставляет модуль csv, как вы упомянули. Текстовые файлы (обычно с суффиксом .txt ) не имеют фиксированного «формата», поэтому вы можете просто прочитать их после открытия их (подробности приведены в ответе Джесси). Файлы CSV обычно представляют собой текстовые файлы, поэтому ваше различие не очень точное.

Что касается RTF, то их очень много. См. этот ответ для подробностей. Тем не менее, PyRTF, о котором упоминал Джесси, кажется наиболее популярным.

Файлы документов Microsoft Word (обычно с суффиксом .doc ) - еще один зверь, поскольку формат является проприетарным. У меня нет большого опыта работы с конвертерами Python, но есть несколько командных строк (например, wvHTML), которые делают довольно приличную работу. В этом вопросе обсуждается довольно много. Также есть возможность сделать это за вас через сам MS-Word. COM-интерфейс, как упомянул Джесси.

4
ответ дан 3 December 2019 в 05:33
поделиться
Другие вопросы по тегам:

Похожие вопросы: