У меня есть куча документов в формате PDF с табличными данными в них, которые мне нужно извлечь в более читаемый формат для хранения в электронной таблице, базе данных или где-либо еще.
в мире есть что-нибудь (желательно бесплатное), способное извлекать табличные данные из PDF-файлов в более читаемый формат оптом , либо изначально встроенное в приложение, либо пассивно через командную строку, либо зацикливая процесс в коде (.net)?
Может быть любой формат на самом деле (док, html) до тех пор, пока поддерживаются таблицы.
Все, что я нашел до сих пор, является либо одноразовым (только один документ за раз, у меня есть сотни, чего не происходит), либо не поддерживает структура таблицы.
Любые идеи, пожалуйста, напишите.