Скаивание данных из PDF до CSV? Python vs php?

У меня есть куча сообщений, которые я передаю каждый день, и он принимает навсегда, поэтому я думал о автоматизации всего процесса. Я буду соскорять данные из: (1) HTML, (2) CSV / XLS, (3) PDF. Я имею в основном только соскобные данные из CSV / HTML с PHP и было заданным вопросом, есть ли какие-либо надежные библиотеки или способы схватывания данных таблицы из PDF в PHP?

Я также начал изучать Python и увидеть, что это может быть Хорошая идея попробовать делать это с PDFMiner в сочетании с Scraphy. Будет ли это лучше? Или есть другие варианты?

Пожалуйста, дайте мне знать. Спасибо!

5
задан tr3online 9 September 2011 в 02:30
поделиться