Вы рекомендуете прочитать код PTX вашего ядра, чтобы узнать, как оптимизировать ваши ядра дальше?
Один пример: я читал, что по коду PTX можно узнать, сработала ли автоматическая развертка цикла. Если это не так, пришлось бы вручную развернуть циклы в коде ядра.