0
ответов

Обработка изображений для OCR с помощью leptonica (инверсный цвет текста)

Я пытаюсь обработать следующее изображение с помощью leptonica, чтобы извлечь текст с помощью tesseract. Исходное изображение :Тессеракт на исходном изображении дает это :i s l D2J1FiiE -l191x1iitmwii9 uhiaiislz -2 Q ~...
вопрос задан: 27 July 2012 22:20
0
ответов

Как сделать tesseract на iOS быстрее?

Я борюсь с tesseract ocr на ios. Все работает нормально, но очень медленно. 2 -Время распознавания одной строки цифр 3 секунды. Я читаю из видеопотока. Я использую...
вопрос задан: 27 July 2012 13:59
0
ответов

Повышение эффективности оптического распознавания символов при сканировании нескольких абзацев -

Я работаю над проектом, который включает в себя извлечение текстовых научных статей, хранящихся в формате PDF. Для большинства статей это довольно легко выполняется с помощью PDFMiner, но некоторые старые статьи хранят свои...
вопрос задан: 25 July 2012 19:10
0
ответов

Анализ макета страницы с помощью Tesseract?

Tesseract 3 может выполнять анализ макета страницы. Однако мне не удалось найти образец кода или документацию о том, как использовать библиотеку для таких целей. Надеюсь, здесь кто-нибудь объяснит, как ...
вопрос задан: 25 July 2012 13:42
0
ответов

Какой идеальный образ для библиотеки tesseract?

Я делаю OCR в своем проекте, используя tesseract. Я использовал изображения с разрешением 72 dpi. Но это дало мне результат, далекий от точности. Я где-то читал, что лучше давать разрешение выше 200 dpi. Но что...
вопрос задан: 24 July 2012 05:32
0
ответов

Lib не нашел ошибку в тессеракте [закрыто]

Я работаю с OCR android. Получил образцы из гугления и работы с Android tesseract. У меня есть проект как библиотека, и я ссылаюсь на другой проект, но когда я запускаю проект, он показывает...
вопрос задан: 17 July 2012 05:30
0
ответов

Тессеракт Android OCR :, использующий данные объектов Pixa для отображения ограничивающих рамок

В настоящее время я играю с OCR на Android. Поэтому я написал небольшое приложение с предварительным просмотром камеры, и теперь я загружаю tessearact tools (tess -два )изображения из моего метода onPreviewFrame. Теперь я хочу...
вопрос задан: 14 July 2012 12:51
0
ответов

Извлечение признаков из нейронных сетей

Я занимаюсь простым распознаванием букв и цифр с помощью нейронных сетей. До сих пор я использовал каждый пиксель изображения буквы в качестве входных данных для сети. Излишне говорить, что этот подход создает сети...
вопрос задан: 11 July 2012 07:12
0
ответов

PDF и текстовый слой

Согласно этому сайту http://www.searchable-pdf.com/content.php?lang=en&c=61, PDF может быть доступен для поиска при добавлении текстового слоя. Я искал техническую спецификацию PDF. Я думаю...
вопрос задан: 10 July 2012 11:57
0
ответов

Как я могу использовать Tesseract в Android?

Я искал в сети пару часов. Я получил много ответов о том, что нам нужно использовать NDK и т. Д. Для "Tesseract" для WINDOWS. Но я не получил пошагового / правильного объяснения того, что должно ...
вопрос задан: 2 July 2012 20:08
0
ответов

Реализация Stroke Width Transform (SWT) (Python)

Кто-нибудь может описать, как я могу реализовать SWT в python, используя opencv или simplecv?
вопрос задан: 20 June 2012 09:06
0
ответов

OCR-библиотека для распознавания чисел на счетчике

Мне нужна OCR-библиотека (желательно на Java), которая сможет определить цифру, отображаемую на счетчиках. Пожалуйста, смотрите изображение. Я пробовал некоторые библиотеки на Java, но они не смогли определить это...
вопрос задан: 20 June 2012 06:39
0
ответов

Как выполнять последовательное распознавание с помощью MODI (Microsoft Office Document Imaging) в C#

У меня есть документы, отсканированные как изображения .jpg в папке, и я хотел бы выполнять распознавание в C# последовательно для каждого из моих документов в этой папке. до сих пор я сделал это: общедоступная строка CheckFilesAndDoOCR(...
вопрос задан: 18 June 2012 14:36
0
ответов

Удалить цвет фона при обработке изображений для OCR

Я пытаюсь удалить цвет фона, чтобы повысить точность распознавания текста для изображений. Пример будет выглядеть следующим образом: Я бы сохранил все буквы в постобработанном изображении, просто удалив ...
вопрос задан: 7 June 2012 12:14
0
ответов

Нужны шаги для создания OCR с использованием opencv

Я пытаюсь создать библиотеку OCR, используя классификатор Haar для opencv. Но это не работает. Можете ли вы сказать мне, каковы шаги для создания OCR? и будет ли это возможно с помощью классификатора Хаара?
вопрос задан: 6 June 2012 06:08
0
ответов

OCR и рассмотрение слова

Я использую Tesseract для своего проекта распознавания буквы, и в настоящее время распознавание довольно хорошо. Часть обработки изображений была сделана, пользуясь библиотеками OpenCv. Буквы являются рукописными. Но там...
вопрос задан: 4 June 2012 02:50
0
ответов

Могу ли я сделать «строка содержит X» с процентной точностью в python?

Мне нужно выполнить распознавание большого фрагмента текста и проверить, содержит ли он определенную строку, но из-за неточности распознавания мне нужно проверить, содержит ли он примерно 85% совпадений для .. .
вопрос задан: 1 June 2012 11:09
0
ответов

Включение Tess4J в Java-проект в качестве библиотеки в Eclipse

У меня пока пустой и чистый Java-проект Eclipse. Что мне нужно сделать, чтобы использовать Tess4J в качестве библиотеки для моего веб-сервиса, который я хочу разработать? Можно ли вообще использовать его как библиотеку для Android...
вопрос задан: 31 May 2012 14:32
0
ответов

Любые визуализации процесса принятия решений нейронной сетью при распознавании изображений?

Я записалась на курс Coursera ML и только начала изучать нейронные сети. Одна вещь, которая меня действительно озадачивает, это то, как распознавание чего-то такого «человеческого», как рукописная цифра, становится…
вопрос задан: 29 May 2012 09:47
0
ответов

обучение тессеракту для рукописного текста

Мне нужно идентифицировать рукописный текст (icr). Нет необходимости понимать произвольный текст - я могу научить своих пользователей писать очень четко, отдельными буквами и т. д. Однако все же будут некоторые ...
вопрос задан: 26 May 2012 01:41
0
ответов

Как извлечь штрих из китайского иероглифа

Я много раз пытался создать алгоритм для извлечения информации о штрихе из китайских иероглифов. Я пробовал различные методы, но ни один из них не дал мне удовлетворительного результата, вероятно, из-за моих ограниченных…
вопрос задан: 20 May 2012 21:04
0
ответов

сканирование изображения и извлечение из него текста Android

Я видел несколько приложений, которые сканируют изображение и возвращают текст. Есть ли для этого библиотека или нет? Я имею в виду либо сканирование текста, либо его фотографирование и идентификацию символов? Я искал...
вопрос задан: 19 May 2012 17:11
0
ответов

Где я могу найти бесплатную библиотеку.Net (C #), которую я могу использовать для сканирования и распознавания документов? [закрыто]

Я ищу бесплатную библиотеку.Net (C #), которую я могу использовать для сканирования со сканера документов, а затем OCR документа, чтобы я мог получить из него текст для сохранения в базе данных. После некоторых поисков я не могу найти...
вопрос задан: 5 May 2012 05:39
0
ответов

Существует ли жизнеспособная библиотека/программа для распознавания рукописного ввода? [закрыто]

Я хочу обработать кучу отсканированных ответных открыток, на которых есть написанная от руки контактная информация (например, имя, адрес, телефон, электронная почта и т. д.). Мне любопытно, существует ли жизнеспособный открытый исходный код...
вопрос задан: 20 April 2012 16:03
0
ответов

Как исправить ошибки сегментации OCR с помощью ограничивающих прямоугольников?

Я использую tesseract для OCR и заметил, что иногда возникают ошибки сегментации и символы, которые «очевидно» принадлежат друг другу, разбиваются на отдельные строки. Основываясь на списке символов...
вопрос задан: 18 April 2012 14:07
0
ответов

Обнаружение конечных точек строк

Я планирую обнаруживать конечные точки строк, сгенерированных из символов (OCR) в C#. Я хочу что-то вроде этого: под «конечной точкой» я подразумеваю то, что я хочу получить концы любых строк в символах... для...
вопрос задан: 18 April 2012 06:09
0
ответов

Какой тип изображения лучше всего подходит для тессеракта?

Я использую tesseract в проекте и хочу узнать, какой тип ввода изображения лучше всего подходит для tesseract, чтобы получить наилучший результат. Binary&TIFF — лучший ввод или есть что-то еще?
вопрос задан: 17 April 2012 14:17
0
ответов

Проблемы с распознаванием цифр в Tesseract -android

Я надеялся, что кто-нибудь может сказать мне, почему мой Tesseract не распознает некоторые изображения с цифрами, и если есть что-то, что я могу сделать об этом. Все работает в соответствии с тестом, и...
вопрос задан: 17 April 2012 08:56
0
ответов

Как обучить SVM в Matlab для распознавания символов?

Я студентка последнего курса, работаю над своим крупным проектом. Мой проект в основном состоит в том, чтобы извлечь текст из естественной сцены, распознать его, а затем отобразить в блокноте и т. д. Я уже извлек...
вопрос задан: 11 April 2012 04:21
0
ответов

Точная классификация бинарных изображений

Я пытаюсь извлечь буквы из игрового поля для проекта. В настоящее время я могу обнаружить игровое поле, разбить его на отдельные квадраты и извлечь изображения каждого квадрата. Ввод, который я получаю...
вопрос задан: 4 April 2012 21:02