текстовая шахта файлы PDF с Python?

Функции класса должны всегда брать сам в качестве своего первого аргумента, таким образом, можно использовать это вместо меня am_class.

def logger(myFunc):
    def new(self, *args, **keyargs):
        print 'Entering %s.%s' % (self.__class__.__name__, myFunc.__name__)
        return myFunc(self, *args, **keyargs)

    return new 

class C(object):
    @logger
    def f(self):
        pass
C().f()

сначала я хотел использовать self.__name__, но это не работает, потому что экземпляр не имеет никакого имени. необходимо использовать self.__class__.__name__ для получения названия класса.

5
задан Burhan Khalid 3 August 2014 в 05:06
поделиться

2 ответа

Используя PyPdf2 , вы можете использовать метод extractText () для извлечения текста PDF и работы с ним.

Обновление: изменен текст для ссылки на PyPdf2, спасибо @Aditya Kumar за внимание.

12
ответ дан 18 December 2019 в 10:46
поделиться

Я не думаю, что вы можете сделать это за один шаг, но вы определенно можете получить текст из PDF с помощью pdfminer . Затем вы можете применить любой текстовый поиск к этим восстановленным данным.

4
ответ дан 18 December 2019 в 10:46
поделиться
Другие вопросы по тегам:

Похожие вопросы: