Если у вас есть элемент с data-foo="bar"
, вы можете получить этот атрибут через
foo.getAttribute("data-foo")
Функция data()
является jQuery function
и не будет работать с Vanilla JS. Впоследствии вам нужно будет использовать
this.getAttribute("data-parentid")
У меня была подобная проблема, когда я писал некоторое программное обеспечение, чтобы сделать книжное сканирование; плавание вокруг в Интернете является программой, названной pagetools, который делает выправление просканированных - на страницах с помощью довольно умного математического приема, названного Радоном, преобразовывают.
Я также записал маленькую стандартную программу, которая будет белый пробел на странице; алгоритмы OCR имеют тенденцию делать намного лучше, когда они не должны бороться с фоновым шумом. То, что я сделал, было, ищут пиксели светлого цвета, которые были больше, чем маленький радиус далеко от темных и затем повышают тех, которые до того, чтобы быть чистым белым.
Это были несколько лет, тем не менее, таким образом, у меня нет точных деталей реализации удобными.
Один простой фильтр изображения для изучения является "Средним Фильтром", который является очень простым, легким для реализации себя, фильтр, чтобы помочь вымыться сканировал/фотографировал текст. http://en.wikipedia.org/wiki/Median_filter
Согласно просьбе свяжитесь с Википедией: Оптическое распознавание символов
Microsoft Research: бумаги Оптического распознавания символов
CiteSeerX: Статьи об оптическом распознавании символов