Програмата SSE трае многу подолго на AMD отколку на Intel

Работам во оптимизација на алгоритам користејќи SSE2 инструкции. Но, наидов на овој проблем кога ја тестирав изведбата:

I) Intel e6750

  1. Да се ​​направи 4 пати повеќе алгоритам што не е SSE2, потребни се 14,85 секунди
  2. Да се ​​направи 1 пат алгоритам SSE2 (ги обработува истите податоци) потребни се 6,89 секунди

II) Phenom II x4 2,8Ghz

  1. Да се ​​направи 4 пати поголем алгоритам што не е SSE2, трае 11,43 секунди
  2. Да се ​​направи 1 пат алгоритам SSE2 (да ги обработи истите податоци) трае 12,15 секунди

Секој може помогни ми зошто се случува ова? Јас сум навистина збунет за резултатите.

И во двата случаи составувам g ++ со употреба на -O3 како знаме.

ПС: Алгоритмот не користи математика со подвижна точка, тој ги користи инструкциите за цел број на ССЕ.

6
задан Santiago Alessandri 19 June 2011 в 16:21
поделиться