Недавно я обновил GTX480 до GTX680 в надежде, что утроенное число ядер проявит себя как значительный прирост производительности в моем коде CUDA. К своему ужасу, я обнаружил, что мои ядра CUDA с интенсивным использованием памяти работают на GTX680 на 30-50% медленнее.
Я понимаю, что это не совсем вопрос программирования, но он напрямую влияет на производительность ядер CUDA на разных устройствах. Кто-нибудь может дать некоторое представление о спецификациях устройств CUDA и о том, как их можно использовать для определения их производительности на ядрах CUDA C?