У меня есть цикл, который был распараллелен с помощью OpenMP, но из-за характера задачи есть 4 критических
предложений.
Каким будет лучший способ профилировать ускорение и выяснить, какие из критических предложений (или, возможно, некритические (!)) Занимают больше всего времени внутри цикла?
I используйте Ubuntu 10.04 с g ++ 4.4.3