Ускорить умножение матриц с помощью SSE (C ++)

Мне нужно выполнить умножение матрицы на вектор 240000 раз в секунду. Матрица 5x5 всегда одна и та же, а вектор меняется на каждой итерации. Тип данных - float. Я думал об использовании некоторых инструкций SSE (или подобных).

1)Меня беспокоит, что количество арифметических операций слишком мало по сравнению с количеством задействованных операций с памятью. Как вы думаете, я смогу добиться заметного улучшения (например,> 20%)?

2) Нужен ли мне компилятор Intel для этого?

3) Можете ли вы указать на некоторые ссылки?

Всем спасибо!

12
задан Enzo 7 July 2011 в 22:11
поделиться