Мне нужно выполнить умножение матрицы на вектор 240000 раз в секунду. Матрица 5x5 всегда одна и та же, а вектор меняется на каждой итерации. Тип данных - float. Я думал об использовании некоторых инструкций SSE (или подобных).
1)Меня беспокоит, что количество арифметических операций слишком мало по сравнению с количеством задействованных операций с памятью. Как вы думаете, я смогу добиться заметного улучшения (например,> 20%)?
2) Нужен ли мне компилятор Intel для этого?
3) Можете ли вы указать на некоторые ссылки?
Всем спасибо!