Am o întrebare despre predicarea ramurilor în GPU-uri. Din câte știu, în GPU-urile, acestea fac predicții cu ramuri.
De exemplu, am un cod de genul acesta:
if (C)
A
else
B
deci dacă A durează 40 de cicluri și B durează 50 de cicluri pentru a termina execuția, dacă presupunem pentru o urzeală, atât A cât și B sunt executate,deci durează în total 90 de cicluri pentru a termina această ramură? Sau se suprapun pe A și B, adică când se execută unele instrucțiuni ale lui A, apoi așteaptă cererea de memorie, apoi se execută unele instrucțiuni ale lui B, apoi așteaptă memoria și așa mai departe? Mulțumesc