Я новичок в программировании на CUDA, и мне было интересно, как производительность pyCUDA сравнивается с программами, реализованными на простом языке C. Будет ли производительность примерно такой же? Есть ли какие-то узкие места, о которых мне следует знать?
EDIT: Я, очевидно, сначала пытался погуглить эту проблему и был удивлен, не обнаружив никакой информации. то есть я бы исключил, что люди pyCUDA ответили на этот вопрос в их FAQ.