Серия v4 компилятора gcc может автоматически векторизовать циклы с использованием процессора SIMD на некоторых современных процессорах, таких как чипы AMD Athlon или Intel Pentium / Core. Как это сделать?
У меня есть вектор __m256d, упакованный четырьмя 64-битными значениями с плавающей запятой .
Мне нужно найти горизонтальный максимум элементов вектора и сохранить результат в скалярном значении двойной точности; Мой...
У меня есть упакованный вектор из четырех 64-битных значений с плавающей запятой.
Я хотел бы получить сумму элементов вектора. С SSE (и с использованием 32-битных чисел с плавающей запятой) я мог просто сделать следующее: v_sum = ...