0
ответов

Могу ли я выполнить предварительную выборку определенных данных на определенный уровень кеша в ядре CUDA?

Я понимаю, что графические процессоры Fermi поддерживают предварительную выборку в кэш L1 или L2. Однако в справочном руководстве CUDA я ничего не могу найти об этом. Dues CUDA позволяет моему коду ядра выполнять предварительную выборку определенных данн
вопрос задан: 19 March 2017 22:28
0
ответов

Стоит ли мне изучить PTX для оптимизации ядра? Если да, то как?

Рекомендуете ли вы прочитать код PTX вашего ядра, чтобы узнать, как оптимизировать ваши ядра дальше? Один пример: я читал, что по коду PTX можно узнать, сработала ли автоматическая развертка цикла. Если ...
вопрос задан: 9 January 2017 18:24
0
ответов

Можно ли поместить инструкции по сборке в код CUDA?

Я хочу использовать код сборки в коде CUDA C чтобы сократить дорогостоящие казни как мы это делаем, используя asm в программировании на C. Возможно ли это?
вопрос задан: 5 November 2015 16:14
0
ответов

Как вывести PTX с аннотациями C/C++ в CUDA 4.1/4.2/5.0

Кто-нибудь знает, как получить ассемблер PTX, аннотированный кодом C/C++ с новым концом LLVM -? Можно легко получить с помощью CUDA 4.0 или более ранней версии, но NVCC отклоняет все мои флаги после обновления инструментария CUDA до...
вопрос задан: 14 July 2012 15:18