Я пытаюсь разбить и изменить структуру массива асинхронно, используя ядро CUDA. memcpy()
не работает внутри ядра, как иcudaMemcpy()
*; Я в растерянности.
Может ли кто-нибудь сказать мне предпочтительный метод копирования памяти из ядра CUDA?
Стоит отметить, cudaMemcpy(void *to, void *from, size, cudaMemcpyDeviceToDevice)
НЕ будет работать для того, что я пытаюсь сделать, потому что его можно вызвать только из-за пределов ядра и он не выполняется асинхронно.