Я понимаю, что ветвление в CUDA не рекомендуется, так как это может отрицательно сказаться на производительности. В своей работе мне приходится реализовывать большие операторы switch, содержащие более нескольких десятков случаев.
Кто-нибудь знает, как сильно это повлияет на производительность. (Официальная документация не очень конкретна) Также есть ли у кого-нибудь более эффективный способ обработки этой части?