Вычисление функций HOG

У меня есть одна проблема на втором этапе, которая заключается в накоплении взвешенных голосов для ориентации градиента над пространственными ячейками.

Предполагая, что ячейка 8 * 8 . Позвольте мне использовать две матрицы GO [8] [8] ([1 9]) , GM [8] [8] для представления ориентации градиента и величины градиента соответственно.

У меня есть одна проблема на втором шаге, которая заключается в накоплении взвешенных голосов за градиентную ориентацию по пространственным ячейкам.

Предполагая, что ячейка равна 8 * 8 . Позвольте мне использовать две матрицы GO [8] [8] ([1 9]) , GM [8] [8] для представления ориентации градиента и величины градиента соответственно.

У меня есть одна проблема на втором шаге, которая заключается в накоплении взвешенных голосов за градиентную ориентацию по пространственным ячейкам.

Предполагая, что ячейка равна 8 * 8 . Позвольте мне использовать две матрицы GO [8] [8] ([1 9]) , GM [8] [8] для представления ориентации градиента и величины градиента соответственно. Ориентация градиента варьируется от 0 до 180 , и есть 9 ячеек ориентации.

Согласно моему пониманию HOG, для каждого пикселя в ячейке, добавляя его градиентную величину к его соответствующий бен ориентации. Таким образом, мы можем иметь гистограмму для каждой ячейки.

Но есть одно предложение, которое меня смущает.

" Чтобы уменьшить наложение, голоса (величина градиента) интерполируются трилинейно между соседними центрами бина в обеих ориентациях and position."1

Why interpolated? How to interpolate? Can someone explains more detailed? No reducing aliasing.

Thanks in advance.


1 This sentence is in Navneet Dalal's PHD thesis, p38, line 4.

7
задан Waqar 9 July 2015 в 14:40
поделиться

1 ответ

Интерполяция - это стандартная техника для вычисления гистограмм. Идея здесь заключается в том, что каждое значение не просто помещается в один бином, а распределяется между двумя соседними бинами (в предположении 1d гистограммы) на основе того, насколько далеко оно находится от центра исходного бина.

Это делается для того, чтобы справиться с ситуациями, когда небольшая ошибка в измерении может привести к тому, что значение будет помещено в другой бином. Это очень хорошо для любого типа гистограмм, а не только для HOG, при условии, что у вас есть процессорные циклы.

Существует также билинейная и трилинейная интерполяция для 2d и 3d гистограмм, где каждое значение распределяется между 4 и 8 соседними бинами соответственно.

8
ответ дан 7 December 2019 в 05:15
поделиться