0
ответов

Оптимизация кода с использованием встроенных функций Intel SSE для векторизации

Я впервые работаю с SSE intrinsics. Я пытаюсь преобразовать простой фрагмент кода в более быструю версию, используя intel SSE intrinsic (до SSE4.2). Кажется, я сталкиваюсь с рядом ...
вопрос задан: 29 January 2019 12:40
0
ответов

В чем разница между __popcnt() и _mm_popcnt_u32()?

MS Visual C++ поддерживает 2 варианта инструкции popcnt на ЦП с SSE4.2: __popcnt() _mm_popcnt_u32() Единственное отличие, которое я обнаружил, заключалось в том, что документация для __popcnt() помечена как «Microsoft...
вопрос задан: 24 January 2019 22:10
0
ответов

Умножение SSE 16 x uint8_t

Я хочу умножить с помощью SSE4 объект __m128i на 16 8-битных целых чисел без знака, но я смог найти только внутреннюю функцию для умножения 16-битных целых чисел. Нет ничего такого, как _mm_mult_epi8?
вопрос задан: 31 January 2016 09:18
0
ответов

Моделирование функциональности packusdw с помощью SSE2

Я реализую функцию быстрого преобразования x888 -> 565 пикселей в pixman по алгоритму, описанному Intel [ пдф]. Их код преобразует x888 -> 555, а я хочу преобразовать в 565. ...
вопрос задан: 14 June 2012 07:47
0
ответов

Предоставляет ли .NET Framework 4.5 поддержку SSE4/AVX?

Кажется, я слышал об этом, но не знаю, где. upd: Я рассказывал про JiT
вопрос задан: 27 May 2012 18:31
0
ответов

Сравнение строк с помощью обёрток SSE4

Мне нужно быстро сравнить две строки на машине с поддержкой SSE4. Как я могу это сделать без написания вставок на ассемблере? Некоторые обертки, такие как long long bitmask = strcmp(char* a, char* b) будут иметь вид ...
вопрос задан: 13 May 2012 20:19