С помощью встроенных функций компилятора Intel, учитывая 128-битный регистр, упаковывающий 8 16-битных элементов, как мне получить доступ (дешево) к произвольным элементам из регистра, для последующего использования из _mm_cvtepi8_epi64
(знак расширяет два 8-битных элемента, упакованных в младшие 16 бит регистра, до двух 64-битных элементов)?
Поясню, почему я спрашиваю:
0x0
и 0xffff ffff ffff ffff
, соответственно.Примечание: Значения 0x0
и 0xff
входного буфера могут быть изменены на наиболее полезные, при условии, что сохраняется эффект маскирования перед суммированием.
Как видно из моего вопроса, мой текущий план выглядит следующим образом, потоковая передача через входные буферы:
Спасибо, Asaf