Когда вопроситель говорит, что «gprof, похоже, работает некорректно», возможно, он ссылается на то, что процессы N MPI могут сбивать файл gmon.out. В этом случае переменная среды (недокументированная) GMON_OUT_PREFIX может сделать gprof более полезной:
$ export GMON_OUT_PREFIX=gmon.out
$ mpiexec -np 4 cpi