Используя Ближайший Соседний Алгоритм для распознавания образов изображения

Таким образом, я хочу смочь распознать шаблоны в изображениях (таких как номер 4), я читал о различных алгоритмах, и я действительно хотел бы использовать Ближайший Соседний алгоритм, это выглядит простым, и я действительно понимаю это на основе этого учебного руководства: проблема http://people.revoledu.com/kardi/tutorial/KNN/KNN_Numerical-example.html, хотя я понимаю, как использовать ее для заполнения пропавших без вести наборов данных, я не понимаю, как я мог использовать ее в качестве инструмента распознавания образов для стремления в Распознавании Формы Изображения. Кто-то мог пролить некоторый свет относительно того, как этот алгоритм мог работать на распознавание образов? Я видел, что учебные руководства используют OpenCV, однако я действительно не хочу пользоваться этой библиотекой, поскольку у меня есть способность сделать предварительную обработку меня, и кажется глупым, что я реализовал бы эту библиотеку только для того, что должно быть простым ближайшим соседним алгоритмом.

10
задан tshepang 21 October 2013 в 20:45
поделиться

1 ответ

Вам просто (просто?) Нужно определить меру «расстояния» для ваших данных.

Предположим, вы уже сегментировали свое большое изображение на маленькие изображения, каждое из которых соответствует текстовому символу, который вы хотите классифицировать. Предположим, что мы имеем дело с цифровыми монохромными изображениями, поэтому каждое изображение представлено в виде прямоугольной матрицы значений (пикселей) в (скажем) целочисленном диапазоне 0-255 (яркость). Также предполагается (NN - это «контролируемый алгоритм классификации»), что у вас есть много уже хорошо классифицированных изображений (ваш обучающий набор).

Для нового небольшого изображения вы должны определить расстояние между двумя изображениями, чтобы было выбрано самое близкое в обучающем наборе, а его «метка» была выбрана как распознанный текстовый символ.

Один наивный подход - взять разность пикселей (например, сумму квадратов). Но эта мера расстояния будет чувствительна к сдвигам (а также поворотам и масштабированию), а мы обычно этого не хотим. Альтернативой было бы вычисление модуля преобразования Фурье, которое инвариантно относительно сдвига (но этого недостаточно). Отсюда вы можете начать - и понять, что проблема сложна, и для того, чтобы такая классификация была приемлемой, требуется много работы.

9
ответ дан 4 December 2019 в 00:23
поделиться
Другие вопросы по тегам:

Похожие вопросы: