Как количественно оценить компромиссы при обработке устройств CUDA для ядер C?

Недавно я обновил GTX480 до GTX680 в надежде, что утроенное число ядер проявит себя как значительный прирост производительности в моем коде CUDA. К своему ужасу, я обнаружил, что мои ядра CUDA с интенсивным использованием памяти работают на GTX680 на 30-50% медленнее.

Я понимаю, что это не совсем вопрос программирования, но он напрямую влияет на производительность ядер CUDA на разных устройствах. Кто-нибудь может дать некоторое представление о спецификациях устройств CUDA и о том, как их можно использовать для определения их производительности на ядрах CUDA C?

11
задан Gearoid Murphy 26 May 2012 в 10:38
поделиться