Для использования параллельных алгоритмов данных на GPU с CUDA есть две стандартные библиотеки, CUDPP и Thrust, реализующие сортировку, сокращение, сумму префиксов и т. д.
Итак, каковы основные различия между библиотеками с точки зрения производительности и возможностей?