Гистограмма ориентированных градиентов

Я читал теорию о дескрипторах HOG для обнаружения объекта (человека). Но у меня есть вопросы по реализации, что может показаться незначительной деталью.

Относительно окна, содержащего блоки; должно ли окно перемещаться по изображению пиксель за пикселем, где окна перекрываются на каждом шаге, как показано здесь: enter image description here

, или следует перемещать окно, не вызывая перекрытия, как здесь: enter image description here

Иллюстрации, которые я видел так далеко использовал второй подход. Но, учитывая размер окна обнаружения 64x128, весьма вероятно, что, перемещая окно по изображению, нельзя покрыть все изображение. Если изображение имеет размер 64х255, то последние 127 пикселей не будут проверяться на предмет объекта. Итак, первый подход кажется более разумным, однако требует больше времени и ресурсов процессора.

Есть идеи? должно ли окно перемещаться по изображению пиксель за пикселем, где окна перекрываются на каждом шаге, как показано здесь: enter image description here

, или следует перемещать окно, не вызывая перекрытия, как здесь: enter image description here

Иллюстрации, которые я видел так далеко использовал второй подход. Но, учитывая размер окна обнаружения 64x128, весьма вероятно, что, перемещая окно по изображению, нельзя покрыть все изображение. Если изображение имеет размер 64х255, то последние 127 пикселей не будут проверяться на предмет объекта. Итак, первый подход кажется более разумным, однако требует больше времени и ресурсов процессора.

Есть идеи? должно ли окно перемещаться по изображению пиксель за пикселем, где окна перекрываются на каждом шаге, как показано здесь: enter image description here

, или следует перемещать окно, не вызывая перекрытия, как здесь: enter image description here

Иллюстрации, которые я видел так далеко использовал второй подход. Но, учитывая размер окна обнаружения 64х128, весьма вероятно, что, перемещая окно по изображению, нельзя покрыть все изображение. Если изображение имеет размер 64x255, то последние 127 пикселей не будут проверяться на предмет объекта. Итак, первый подход кажется более разумным, однако требует больше времени и ресурсов процессора.

Есть идеи? учитывая, что окно обнаружения имеет размер 64x128, весьма вероятно, что, перемещая окно по изображению, невозможно охватить все изображение. Если изображение имеет размер 64x255, то последние 127 пикселей не будут проверяться на предмет объекта. Итак, первый подход кажется более разумным, однако требует больше времени и ресурсов процессора.

Есть идеи? Учитывая, что окно обнаружения имеет размер 64x128, весьма вероятно, что, перемещая окно по изображению, нельзя покрыть все изображение. Если изображение имеет размер 64x255, то последние 127 пикселей не будут проверяться на предмет объекта. Итак, первый подход кажется более разумным, однако требует больше времени и ресурсов процессора.

Есть идеи? Заранее благодарю.

РЕДАКТИРОВАТЬ: Я стараюсь придерживаться оригинальной статьи Далала и Триггса. Один документ, в котором реализован алгоритм и использует второй подход, можно найти здесь: http://www.cs.bilkent.edu.tr/~cansin/projects/cs554-vision/pedestrian-detection/pedestrian-detection- paper.pdf

12
задан Ahmet Keskin 8 April 2011 в 18:43
поделиться