Я создал небольшое приложение SIFT, которое захватывает ключевые точки и сохраняет их в текстовый файл. Я использую это для получения информации из логотип (скажем, AT&T) и используйте его для сравнения с другими изображениями с этим логотипом. Проблема в том, что на многих моих изображениях есть вариации логотипа, которые не отображаются из-за масштабирования, поворота или освещения. Мне было интересно, можно ли получить набор изображений, захватить их ключевые точки и пропустить их через какой-то обучающий алгоритм для улучшения обнаружения.
Я искал в Интернете способы обучения ключевых точек SIFT, но они все находятся в какой-то докторской диссертации, которая описывает все эти математические алгоритмы, что, честно говоря, сбивает меня с толку, так как я давно не ходил ни в какие математические классы.
Если у кого-то есть какие-либо советы или ссылки, чтобы иметь возможность понять, как работает обучение или что необходимо сделать для его реализации, дайте мне знать. Или, если у кого-то есть более простые способы сделать это без SIFT, я был бы очень признателен за другие формы обнаружения. Ниже приведен список того, что я пробовал:
Заранее спасибо