19
ответов

Как извлечь и обработать текст из файла docx с помощью python? [Дубликат]

У меня есть файл docx, который я преобразовал в текст, используя библиотеку docx2txt. После этого мне нужно извлечь текст между ними. Я использовал регулярное выражение для задачи, но оно просто показывает «[]» как вывод. ...
вопрос задан: 19 April 2015 20:59
2
ответа

Как я могу создать документ Word (.docx), если он не найден с использованием Python, и написать в нем?

Как я могу создать документ Word (.docx), если он не найден с использованием Python, и написать в нем? Я, конечно, не могу выполнить одно из следующих действий: file = open (file_name, 'r') file = open (file_name, 'w') или, чтобы ...
вопрос задан: 16 January 2019 08:42
1
ответ

невозможно получить данные из таблицы в текстовом документе

Я пытаюсь прочитать данные из таблицы документов Word. Я могу читать и распечатывать данные. Но для нескольких таблиц я не могу видеть какие-либо данные во время печати, но я могу видеть данные в текстовом документе. Я ...
вопрос задан: 29 March 2019 09:45
1
ответ

выравнивание ячейки таблицы python-doxc добавляет новую строку

Я хочу выровнять текст внутри ячейки таблицы документа Word, созданного с помощью python-docx. Я следовал этому совету, но проблема в том, что новая строка добавляется внутри ячейки перед ...
вопрос задан: 18 January 2019 05:56
1
ответ

разница между типом новых строк

У меня есть два документа, один файл .txt, а другой файл .docx. Я преобразовал файл .txt в файл документа, используя pyhton-docx. с открытым (out_file_path, 'r') как text_file: book_text = text_file.read () ...
вопрос задан: 16 January 2019 04:11
1
ответ

Элегантный способ удаления абзаца с помощью python-docx? [Дубликат]

Иногда полезно удалить абзац из уже существующего файла docx. Это относительно легко сделать с: paragraph.text = '' Интересно, есть ли более чистый способ удалить ...
вопрос задан: 26 March 2015 17:01
0
ответов

Есть ли обходной путь для динамического добавления сносок Microsoft Word в Python?

В настоящее время я использую Python Flask для создания приложения для генерации форматированного документа из данных, хранящихся в базе данных sql. Моя идея состояла в том, чтобы обнаружить метки сносок в тексте и сделать сноски ...
вопрос задан: 27 March 2019 23:58
0
ответов

Как извлечь текст из существующего файла docx, используя python-docx

Я пытаюсь использовать модуль python-docx (pip install python-docx), но это кажется очень запутанным, поскольку в тестовом примере репозитория github они используют функцию opendocx, но в readthedocs они используют ...
вопрос задан: 10 August 2014 12:15