У меня есть одна проблема на втором этапе, которая заключается в накоплении взвешенных голосов для ориентации градиента над пространственными ячейками.
Предполагая, что ячейка 8 * 8
. Позвольте мне использовать две матрицы GO [8] [8] ([1 9])
, GM [8] [8]
для представления ориентации градиента и величины градиента соответственно.
У меня есть одна проблема на втором шаге, которая заключается в накоплении взвешенных голосов за градиентную ориентацию по пространственным ячейкам.
Предполагая, что ячейка равна 8 * 8
. Позвольте мне использовать две матрицы GO [8] [8] ([1 9])
, GM [8] [8]
для представления ориентации градиента и величины градиента соответственно.
У меня есть одна проблема на втором шаге, которая заключается в накоплении взвешенных голосов за градиентную ориентацию по пространственным ячейкам.
Предполагая, что ячейка равна 8 * 8
. Позвольте мне использовать две матрицы GO [8] [8] ([1 9])
, GM [8] [8]
для представления ориентации градиента и величины градиента соответственно.
Ориентация градиента варьируется от 0 до 180
, и есть 9
ячеек ориентации.
Согласно моему пониманию HOG, для каждого пикселя в ячейке, добавляя его градиентную величину к его соответствующий бен ориентации. Таким образом, мы можем иметь гистограмму для каждой ячейки.
Но есть одно предложение, которое меня смущает.
" Чтобы уменьшить наложение, голоса (величина градиента) интерполируются трилинейно между соседними центрами бина в обеих ориентациях and position."1
Why interpolated? How to interpolate? Can someone explains more detailed? No reducing aliasing.
Thanks in advance.
1 This sentence is in Navneet Dalal's PHD thesis, p38, line 4.
Интерполяция - это стандартная техника для вычисления гистограмм. Идея здесь заключается в том, что каждое значение не просто помещается в один бином, а распределяется между двумя соседними бинами (в предположении 1d гистограммы) на основе того, насколько далеко оно находится от центра исходного бина.
Это делается для того, чтобы справиться с ситуациями, когда небольшая ошибка в измерении может привести к тому, что значение будет помещено в другой бином. Это очень хорошо для любого типа гистограмм, а не только для HOG, при условии, что у вас есть процессорные циклы.
Существует также билинейная и трилинейная интерполяция для 2d и 3d гистограмм, где каждое значение распределяется между 4 и 8 соседними бинами соответственно.