Зачем вообще знать о CUDA Warps?

У меня GeForce GTX460 SE, так что это :6 SM x 48 ядер CUDA = 288 ядер CUDA. Известно, что в одном варпе содержится 32 потока, и что в одном блоке одновременно (за раз )может выполняться только один варп. То есть в одном мультипроцессоре (SM )может одновременно выполнять только один Блок, один Варп и только 32 потока, даже если доступно 48 ядер?

Кроме того, в качестве примера для распределения конкретных потоков и блоков можно использовать threadIdx.x и blockIdx.x. Для их размещения используйте ядро ​​<<< Blocks, Threads >>> (). Но как выделить конкретное количество варпов -и распределить их, а если это невозможно, то зачем вообще знать о варпах?

16
задан einpoklum - reinstate Monica 9 November 2016 в 09:18
поделиться