HOG Трилинейная интерполяция интервалов гистограммы

Я работаю над особенностями гистограммы ориентированного градиента (HOG), и я пытаюсь реализовать трилинейную интерполяцию бинов гистограммы, как описано в докторской диссертации Далала. И он объясняет процесс интерполяции, как цитируется ниже:

РЕДАКТИРОВАТЬ: грубо говоря, функции HOG извлекаются из окна 64x128 пикселей, которое разделено на блоки. Каждый блок состоит из ячеек 2x2, а размер ячейки составляет 8x8 пикселей. Извлечение начинается с вычисления производных первого порядка изображения, затем вычисляются ориентация и величина каждого пикселя. Гистограмма ориентации внутри блока для каждой ячейки 8x8 пикселей вычисляется, где пиксели вносят вклад в гистограмму со значением величины, основанной на ориентации пикселя, а величина интерполируется между центрами соседних интервалов как по ориентации, так и по положению. Гистограмма содержит 9 интервалов, представляющих 0–180 градусов с шагом 20 градусов. Общее описание алгоритма можно увидеть здесь: http://4.bp.blogspot.com/_7NBDeKCsVHg/TKBbldI8GmI/AAAAAAAAAG0/G-OXUz1ouPQ/s1600/a1.bmp

Сначала мы описываем линейную интерполяцию в одномерном пространстве, а затем расширить его до 3-D. Пусть h - гистограмма с расстоянием между бункерами (пропускной способностью) b. h (x) обозначает значение гистограмма для интервала с центром в точке x. Предположим, что мы хотим интерполировать вес w в точке x в гистограмма. Пусть x1 и x2 - два ближайшие соседние бины точки x такой, что x1 ≤ x

Пусть w в трехмерной точке x = [x, y, z] - вес, который нужно интерполировать. Позволять x1 и x2 - два угловых вектора куб гистограммы, содержащий x, где в каждой компоненте x1 ≤ x

.

Мы вычисляем гистограмму для ячеек, и каждый пиксель вносит свою величину в гистограмму. Из формулировки я понимаю, что x и y представляют расположение ячеек в окне обнаружения, а z - номер ячейки. В окне обнаружения 64x128 есть 8x16 ячеек и 9 интервалов ориентации, так что наша гистограмма представлена ​​как h (8,16,9). Если приведенные выше утверждения верны, представляют ли (x1, y1) и (x2, y2) предыдущие и буквенные ячейки соответственно? Означают ли z1 и z2 ячейки предыдущей и буквенной ориентации? Как насчет пропускной способности b = [bx, by, bz]?

Буду очень признателен, если кто-нибудь сможет прояснить эти вопросы.

Спасибо.

8
задан Ahmet Keskin 4 July 2011 в 09:33
поделиться