Я понимаю, что графические процессоры Fermi поддерживают предварительную выборку в кэш L1 или L2. Однако в справочном руководстве CUDA я ничего не могу найти об этом.
Dues CUDA позволяет моему коду ядра предварительно загружать определенные данные в определенный уровень кеша?