У меня есть куча сообщений, которые я передаю каждый день, и он принимает навсегда, поэтому я думал о автоматизации всего процесса. Я буду соскорять данные из: (1) HTML, (2) CSV / XLS, (3) PDF. Я имею в основном только соскобные данные из CSV / HTML с PHP и было заданным вопросом, есть ли какие-либо надежные библиотеки или способы схватывания данных таблицы из PDF в PHP?
Я также начал изучать Python и увидеть, что это может быть Хорошая идея попробовать делать это с PDFMiner в сочетании с Scraphy. Будет ли это лучше? Или есть другие варианты?
Пожалуйста, дайте мне знать. Спасибо!