Я портирую код SSE SIMD для использования 256-битных расширений AVX и не могу найти никаких инструкций, которые бы смешивали / перемешивали / перемещали высокие 128 бит и младшие 128 бит.
Вспомогательная история:
Я действительно хочу, чтобы VHADDPS
/ _mm256_hadd_ps
действовал как HADDPS
/ _mm_hadd_ps
, только с 256-битными словами. К сожалению, он действует как два вызова HADDPS
, действующих независимо на младшие и старшие слова.