Оптимизация кода SSE GCC

Question

Оптимизация кода SSE GCC

Этот пост тесно связан с другим постом, который я опубликовал несколько дней назад . На этот раз я написал простой код, который просто добавляет пару массивов элементов, умножает результат на значения в другом массиве и сохраняет его в четвертом массиве, все переменные с плавающей запятой с двойной точностью.

Я сделал две версии этого кода: одну с инструкциями SSE, используя вызовы, и другую без них. Затем я скомпилировал их с уровнем оптимизации gcc и -O0. Я пишу их ниже:

// SSE VERSION

#define N 10000
#define NTIMES 100000
#include 
#include 
#include 
#include 

double a[N] __attribute__((aligned(16)));
double b[N] __attribute__((aligned(16)));
double c[N] __attribute__((aligned(16)));
double r[N] __attribute__((aligned(16)));

int main(void){
  int i, times;
  for( times = 0; times < NTIMES; times++ ){
     for( i = 0; i

При компиляции с -O0, gcc использует регистры XMM / MMX и инструкции SSE, если специально не заданы параметры -mno-sse (и другие). Я проверил ассемблерный код, сгенерированный для второго кода, и заметил, что он использует инструкции movsd , addd и mulsd . Таким образом, он использует инструкции SSE, но только те, которые используют младшую часть регистров, если я не ошибаюсь. Ассемблерный код, сгенерированный для первого кода C, как и ожидалось, использовал инструкции addp и mulpd , хотя был сгенерирован гораздо больший ассемблерный код.

В любом случае, первый код должен получить больше пользы, насколько мне известно, от парадигмы SIMD, поскольку на каждой итерации вычисляются два результирующих значения.Тем не менее, второй код выполняет что-то вроде на 25 процентов быстрее, чем первый. Я также провел тест со значениями одинарной точности и получил аналогичные результаты. В чем причина этого?


         
            14

         
         
            c optimization sse compiler-optimization hpc         
         
         
            задан Community            23 May 2017 в 12:25 
         
         
         поделиться


  

      
    

    
   
   
      0 ответов
      

      
         
                     
      

            
          Другие вопросы по тегам:          
         c optimization sse compiler-optimization hpc       
        Похожие вопросы:

        
          
                          65 
 Каково худшее реальное злоупотребление macros/pre-processor, с которым Вы когда-либо сталкивались? - 23 May 2017 12:34 
                            55 
 Какие важные понятия в Си, которые вы не узнали от своих учителей? [закрыто] - 6 September 2017 17:22 
                            51 
 Почему это считают плохой практикой для исключения фигурных скобок? [закрытый] - 19 August 2016 17:07 
                            48 
 Скрытые возможности C - 25 September 2017 20:52 
                            44 
 Утечки памяти, когда-нибудь в порядке? [закрытый] - 2 October 2011 04:00 
                            39 
 Форматирование если Операторы - 17 January 2014 19:45 
                            39 
 Какую самую нелепую пессимизацию вы видели? [закрыто] - 3 May 2012 14:43