При использовании закрепленной памяти в ArrayFire у меня снижается производительность. Я пробовал различные способы создания закрепленной памяти и создания массивов из нее, например. cudaMallocHost. Использование cudaMallocHost w / cudaMemcpy ...
Недавно я посмотрел на использование вычислений на GPU, где использование пакетов казалось непонятным. Например, CuArrays и ArrayFire, казалось, делали то же самое, где ArrayFire казался