Обработка изображений / алгоритмы улучшения для OCR документа / удобочитаемость?

Question

Обработка изображений / алгоритмы улучшения для OCR документа / удобочитаемость?

Если у вас есть элемент с data-foo="bar", вы можете получить этот атрибут через

foo.getAttribute("data-foo")

Функция data() является jQuery function и не будет работать с Vanilla JS. Впоследствии вам нужно будет использовать

this.getAttribute("data-parentid")

9

ocr

задан Parand 5 April 2009 в 00:26

3 ответа

Другие вопросы по тегам:

ocr

Похожие вопросы:

score 5 · Answer 1

У меня была подобная проблема, когда я писал некоторое программное обеспечение, чтобы сделать книжное сканирование; плавание вокруг в Интернете является программой, названной pagetools, который делает выправление просканированных - на страницах с помощью довольно умного математического приема, названного Радоном, преобразовывают.

Я также записал маленькую стандартную программу, которая будет белый пробел на странице; алгоритмы OCR имеют тенденцию делать намного лучше, когда они не должны бороться с фоновым шумом. То, что я сделал, было, ищут пиксели светлого цвета, которые были больше, чем маленький радиус далеко от темных и затем повышают тех, которые до того, чтобы быть чистым белым.

Это были несколько лет, тем не менее, таким образом, у меня нет точных деталей реализации удобными.

score 4 · Answer 2

Один простой фильтр изображения для изучения является "Средним Фильтром", который является очень простым, легким для реализации себя, фильтр, чтобы помочь вымыться сканировал/фотографировал текст. http://en.wikipedia.org/wiki/Median_filter

score 2 · Answer 3

Согласно просьбе свяжитесь с Википедией: Оптическое распознавание символов

Microsoft Research: бумаги Оптического распознавания символов

CiteSeerX: Статьи об оптическом распознавании символов