Какое максимальное количество блоков в сетке может быть создано за один запуск ядра? Я немного сбит с толку, поскольку
Теперь таблица вычислительных возможностей здесь говорит, что в CUDA compute capacity 2.0 может быть 65535 блоков на размер сетки.
Означает ли это, что общее количество блоков = 65535 * 65535?
Или это означает, что вы можете переставить не более 65535 в 1d сетку из 65536 блоков. or 2d grid of sqrt(65535) * sqrt(65535) ?
Thank you.