Программно извлекать таблицы PDF

У меня есть куча документов в формате PDF с табличными данными в них, которые мне нужно извлечь в более читаемый формат для хранения в электронной таблице, базе данных или где-либо еще.

в мире есть что-нибудь (желательно бесплатное), способное извлекать табличные данные из PDF-файлов в более читаемый формат оптом , либо изначально встроенное в приложение, либо пассивно через командную строку, либо зацикливая процесс в коде (.net)?

Может быть любой формат на самом деле (док, html) до тех пор, пока поддерживаются таблицы.

Все, что я нашел до сих пор, является либо одноразовым (только один документ за раз, у меня есть сотни, чего не происходит), либо не поддерживает структура таблицы.

Любые идеи, пожалуйста, напишите.

21
задан Brian Tompsett - 汤莱恩 8 June 2017 в 18:04
поделиться