У меня есть код cuda, в котором я реализовал несколько двухмерных БПФ C2C. Все они используют один и тот же план, но по какой-то причине время двумерного БПФ велико и, кажется, сильно различается немного. БПФ одного и того же размера данных занимает от 0,4 до 1,8 с
Это для БПФ 1920х1080. Эти времена кажутся разумными?
Как бы то ни было - у меня был хороший опыт с быстрыми пакетными БПФ CUDA 1-D. это то же самое, что выполнить одномерное БПФ по строкам, а затем снова по столбцам матрицы, чтобы получить те же результаты, что и это 2D БПФ? У меня есть опыт БПФ, происходящего за несколько сотых секунды в больших наборах данных для одномерных БПФ, поэтому я надеялся исправить некоторые из этих результатов.
Спасибо