1
ответ

OCR на двоичном изображении

У меня есть двоичное текстовое изображение, похожее на черно-белый текст - кошка, я хочу выполнить OCR для таких изображений Они содержат не более одного слова. Я пробовал тессеракт и облачное видение Google, но ...
вопрос задан: 21 March 2019 19:21
0
ответов

Почему на Tesseract OCR влияет верхний ряд из двух пикселей, и как я могу получить последовательные результаты

Я пытаюсь прочитать значение из всплывающего диалога. Я использую openCV, чтобы найти значок информации и кнопку Закрыть. Затем я обрезаю область между ними. Это мои всплывающие диалоги: Popup90409.png и Popup90411.png Я ...
вопрос задан: 25 March 2019 09:38
0
ответов

преобразование PDF в изображение, но после увеличения

Эта ссылка показывает, как PDF-файлы могут быть преобразованы в изображения. Есть ли способ увеличить мои PDF-файлы перед преобразованием в изображения? В моем проекте я конвертирую pdf в png, а затем использую библиотеку Python-tesseract ...
вопрос задан: 22 March 2019 17:58
0
ответов

Автоматическое определение необходимого угла и четных изображений для распознавания текста

В настоящее время я работаю над проектом обнаружения + распознавания. Детектирующая часть проекта приводит к нескольким тысячам обрезанных изображений, содержащих текст (последовательность из 11 цифр и букв). ...
вопрос задан: 19 March 2019 08:23
0
ответов

Tesseract - [японский] вертикальный текст с горизонтальными числами

У меня проблемы с вертикальным текстом, смешанным с горизонтальными числами. Например: если бы это была одна цифра, это было бы успешно, но tesseract пытается прочитать это число как один символ ...
вопрос задан: 2 March 2019 02:03
0
ответов

Tesseract с использованием Python

Я писал код для извлечения текста из изображений, используя библиотеку pytesseract в Python. Это мой код text = pytesseract.image_to_string (Image.open ("Figure_3.png")) print (text) fig, (ax1) = plt ....
вопрос задан: 13 July 2018 11:30
0
ответов

OCR Tesseract: возможность разделения заголовков текста

Я использую tesseract (через оболочку python), чтобы извлечь текст из документов. Эти документы не содержат никаких изображений или таблиц, просто текст. Есть ли возможность отличить ...
вопрос задан: 13 July 2018 07:46
0
ответов

Получение ограничивающего прямоугольника распознанных слов с помощью python-tesseract

Я использую python-tesseract для извлечения слов из изображения. Это оболочка Python для tesseract, которая представляет собой код OCR. Я использую следующий код для получения слов: import tesseract api = ...
вопрос задан: 30 December 2013 00:15