У меня есть проект CUDA. Он состоит из нескольких файлов .cpp, содержащих логику моего приложения, и одного файла .cu, который содержит несколько ядер, а также функцию __ host __
, которая их вызывает.
Теперь я хотел бы определить количество регистров, используемых мое ядро (я). Мой обычный вызов компилятора выглядит так:
nvcc -arch compute_20 -link src / kernel.cu obj / .. obj obj / .. obj .. -o bin / .. exe -l glew32 ..
.
Добавление к этому вызову флага компилятора «-Xptxas –v», к сожалению, не имеет никакого эффекта. Компилятор по-прежнему производит тот же текстовый вывод, что и раньше. Скомпилированный .exe также работает так же, как и раньше, за одним исключением: моя частота кадров увеличивается с 80 до 1800 кадров в секунду.