Существует ли аналог memcpy (), работающий внутри ядра CUDA?

Я пытаюсь разбить и изменить структуру массива асинхронно, используя ядро ​​CUDA. memcpy()не работает внутри ядра, как иcudaMemcpy()*; Я в растерянности.

Может ли кто-нибудь сказать мне предпочтительный метод копирования памяти из ядра CUDA?

Стоит отметить, cudaMemcpy(void *to, void *from, size, cudaMemcpyDeviceToDevice)НЕ будет работать для того, что я пытаюсь сделать, потому что его можно вызвать только из-за пределов ядра и он не выполняется асинхронно.

19
задан talonmies 12 June 2016 в 10:19
поделиться