Есть ли какие-либо свободные библиотеки OCR, которые работают с PHP или Python на сервере Linux? Идея состоит в том, чтобы смочь загрузить изображение и вытащить символы из него или позволить пользователям "тянуть символы" и анализировать их из упомянутого изображения.
Так как вы находитесь на поле Linux, я бы очень рекомендую проект с открытым исходным кодом Google ocropus .
Это не PHP, но я думаю, что это будет ваш лучший вариант. Конечно, вы можете назвать его из PHP через EXEC
. Его зрелый и имеет много вариантов. С сайта проекта:
Econropus Engine основан на двух исследовательских проектах: высокопроизводительный распознатель почерков, разработанный в середине 90-х годов и развернул бюро переписей США и новым высокопроизводительным методам анализа макета.
Существует еще один проект с открытым исходным кодом, Tesseract . Я использовал это в прошлом, а также доволен результатами. Включает тренинг, ограничивающий свой алфавит и т. Д.