הדרך המהירה ביותר לעשות סכום וקטורי צף אופקי ב- x86

יש לך וקטור של שלושה (או ארבעה) צפים. מהי הדרך המהירה ביותר לסכם אותם?

האם SSE (movaps, shuffle, add, movd) תמיד מהיר יותר מ- x87? האם ההוראות להוסיף לרוחב ב- SSE4.2 שוות את זה? מה העלות למעבר ל- FPU, ואז faddp, faddp? מהו רצף ההוראות הספציפי המהיר ביותר?

"נסה לסדר דברים כך שתוכל לסכם ארבעה וקטורים בכל פעם" לא יתקבל כתשובה. : -)

41
задан FeepingCreature 9 August 2011 в 13:16
поделиться