Синхронизация различных разделов в ядре CUDA

У меня есть ядро ​​CUDA, которое вызывает ряд функций устройства.

Как лучше всего получить время выполнения каждой из функций устройства?

Как лучше всего получить время выполнения участка кода в одной из функций устройства?

10
задан Roger Dahl 26 June 2012 в 14:10
поделиться