Дескрипторы изображений с SIFT / VLFEAT

я хочу выполнить задачу классификации, в которой я сопоставляю заданное изображение объекта с одним из списка предопределенных созвездий, в которых может находиться объект (т. Е. Найти наиболее вероятное совпадение). Для получения дескрипторов изображения (на котором я буду запускать алгоритмы машинного обучения) мне было предложено использовать SIFT с реализацией VLFeat.

Прежде всего, мой главный вопрос - я хотел бы проигнорировать часть поиска ключевых точек в sift и использовать ее только для ее дескрипторов. В учебнике я увидел, что есть возможность сделать именно это, позвонив по номеру

[f, d] = vl_sift (I, 'кадры', fc);

где fc указывает ключевые точки. Моя проблема в том, что я хочу явно указать ограничивающая рамка, в которой я хочу вычислить дескрипторы вокруг ключевой точки, но, похоже, я могу указать только параметр масштаба, который сейчас немного загадочен для меня и не позволяет мне явно указать ограничивающую рамку. Есть ли способ добиться этого?

Второй вопрос: имеет ли смысл устанавливать масштаб вручную и получать дескрипторы таким образом? (т.е. получить хороший дескриптор?). Есть ли другие предложения относительно лучших способов получения дескрипторов? (используя SIFT с другими реализациями или другими дескрипторами, отличными от SIFT). Я должен отметить, что мой объект всегда является единственным объектом на изображении, он центрирован, имеет постоянное освещение, и изменения за счет некоторых видов вращения его внутренних частей - И вот почему я подумал, что SIFT сработает, поскольку я понял, что он фокусируется на градиентах ориентации, которые будут меняться соответственно с поворотами объекта.

Спасибо

6
задан Dan 21 March 2011 в 08:08
поделиться