יש לך וקטור של שלושה (או ארבעה) צפים. מהי הדרך המהירה ביותר לסכם אותם?
האם SSE (movaps, shuffle, add, movd) תמיד מהיר יותר מ- x87? האם ההוראות להוסיף לרוחב ב- SSE4.2 שוות את זה? מה העלות למעבר ל- FPU, ואז faddp, faddp? מהו רצף ההוראות הספציפי המהיר ביותר?
"נסה לסדר דברים כך שתוכל לסכם ארבעה וקטורים בכל פעם" לא יתקבל כתשובה. : -)