мне нужно рассчитать время выполнения ядра CUDA. В «Руководстве по передовой практике» говорится, что мы можем использовать в Windows либо события, либо стандартные функции времени, такие как clock ()
. Моя проблема в том, что использование этих двух функций дает мне совершенно другой результат.
На самом деле результат, который дают события, кажется огромным по сравнению с реальной скоростью на практике.
На самом деле все это мне нужно для того, чтобы иметь возможность предсказать время выполнения вычисления, сначала запустив его сокращенную версию на меньшем наборе данных. К сожалению, результаты этого теста совершенно нереалистичны, они либо слишком оптимистичны ( clock ()
), либо слишком пессимистичны (события).