У меня есть 'N' потоков для одновременного выполнения на устройстве, которым им нужно M * N float из глобальной памяти. Как правильно получить доступ к объединенной глобальной памяти? В этом вопросе, как общая память может помочь?