Я хотел бы использовать аппаратный счетчик производительности , в частности, процессоры x86, чтобы получать промахи в кэше или неверное предсказание переходов. Счетчики производительности широко используются в продвинутых профилировщиках, таких как Intel VTune. Пожалуйста, не путайте счетчики производительности в операционных системах Windows.
Чтобы использовать эти счетчики в программе C / C ++, можно использовать PAPI: http://icl.cs.utk.edu/papi/
Это позволяет легко использовать счетчики производительности, но только на Linux. Когда-то PAPI поддерживал Windows, но не сейчас.
Есть ли кто-нибудь, кто недавно пробовал использовать PAPI или другие API-интерфейсы для использования аппаратных счетчиков производительности в Windows?