В CUDA существует концепция деформации , которая определяется как максимальное количество потоков, которые могут выполнять одну и ту же инструкцию одновременно в одном обрабатывающем элементе. Для NVIDIA этот размер искажения составляет 32 для всех карт, представленных в настоящее время на рынке.
В картах ATI используется аналогичная концепция, но терминология в этом контексте - волновой фронт . После некоторого поиска я обнаружил, что у моей карты ATI размер волнового фронта равен 64.
Мой вопрос: что я могу сделать, чтобы запросить эту ширину SIMD во время выполнения для OpenCL?