0
ответов

Использование встроенных функций AVX вместо SSE не улучшает скорость - почему?

Я уже довольно давно использую встроенные функции Intel SSE с хорошим приростом производительности. Следовательно, я ожидал, что встроенные функции AVX еще больше ускорят мои программы. К сожалению, этого не произошло ...
вопрос задан: 19 January 2012 10:47
0
ответов

Как регистры AVX обрабатываются в соответствии с общими соглашениями о вызовах?

Я не смог найти ни одного документа, определяющего, как регистры YMM обрабатываются вызывающим и вызываемым. Чтобы сфокусировать свой вопрос, вот что я хотел бы знать: какие регистры YMM должны быть восстановлены ...
вопрос задан: 15 January 2012 08:27
0
ответов

Эквивалент _mm_alignr_epi8 (PALIGNR) в AVX2

В SSE3 инструкция PALIGNR выполняет следующее: PALIGNR объединяет целевой операнд (первый операнд) и исходный операнд (второй операнд) в промежуточную композицию, ...
вопрос задан: 15 December 2011 10:05
0
ответов

Сохранение отдельных двойников из упакованного двойного вектора с использованием Intel AVX

Я пишу код, используя встроенные функции C для инструкций Intel AVX. Если у меня есть упакованный двойной вектор (a __m256d), то каков будет наиболее эффективный способ (т.е. наименьшее количество операций) для хранения ...
вопрос задан: 9 December 2011 04:07
0
ответов

Как я могу обменять младшие 128 бит и старшие 128 бит в 256-битном регистре AVX (YMM)

Я портирую SSE SIMD-код для использования 256-битных расширений AVX и не могу найти ни одной инструкции, которая будет смешивать / перемешивать / перемещать высокие 128 бит и младшие 128 бит. Вспомогательная история: Что ...
вопрос задан: 27 August 2011 21:37
0
ответов

Как заставить gcc использовать все регистры SSE (или AVX)?

Я пытаюсь написать вычислительно-интенсивный код для целевой платформы Windows x64 с SSE или новыми инструкциями AVX, компилируемыми в GCC 4.5 .2 и 4.6.1, MinGW64 (сборка TDM GCC и некоторая пользовательская сборка). ...
вопрос задан: 11 May 2011 07:29
0
ответов

Использование инструкций AVX отключает оптимизацию exp ()?

Я пишу сеть прямого распространения на VC ++ с использованием встроенных функций AVX. Я вызываю этот код через PInvoke в C #. Моя производительность при вызове функции, которая вычисляет большой цикл, включая функцию exp () ...
вопрос задан: 5 May 2011 00:22