Обработка изображений / алгоритмы улучшения для OCR документа / удобочитаемость?

Если у вас есть элемент с data-foo="bar", вы можете получить этот атрибут через

foo.getAttribute("data-foo")

Функция data() является jQuery function и не будет работать с Vanilla JS. Впоследствии вам нужно будет использовать

this.getAttribute("data-parentid")
9
задан Parand 5 April 2009 в 00:26
поделиться

3 ответа

У меня была подобная проблема, когда я писал некоторое программное обеспечение, чтобы сделать книжное сканирование; плавание вокруг в Интернете является программой, названной pagetools, который делает выправление просканированных - на страницах с помощью довольно умного математического приема, названного Радоном, преобразовывают.

Я также записал маленькую стандартную программу, которая будет белый пробел на странице; алгоритмы OCR имеют тенденцию делать намного лучше, когда они не должны бороться с фоновым шумом. То, что я сделал, было, ищут пиксели светлого цвета, которые были больше, чем маленький радиус далеко от темных и затем повышают тех, которые до того, чтобы быть чистым белым.

Это были несколько лет, тем не менее, таким образом, у меня нет точных деталей реализации удобными.

5
ответ дан 4 December 2019 в 20:24
поделиться

Один простой фильтр изображения для изучения является "Средним Фильтром", который является очень простым, легким для реализации себя, фильтр, чтобы помочь вымыться сканировал/фотографировал текст. http://en.wikipedia.org/wiki/Median_filter

4
ответ дан 4 December 2019 в 20:24
поделиться
Другие вопросы по тегам:

Похожие вопросы: