Как профилировать узкие места OpenMP

У меня есть цикл, который был распараллелен с помощью OpenMP, но из-за характера задачи есть 4 критических предложений.

Каким будет лучший способ профилировать ускорение и выяснить, какие из критических предложений (или, возможно, некритические (!)) Занимают больше всего времени внутри цикла?

I используйте Ubuntu 10.04 с g ++ 4.4.3

6
задан Mikhail 24 August 2011 в 19:38
поделиться