У меня есть массив логических и вы хотите отправить их через сеть. Тем не менее, я только хочу отправить один бит за логическое значение, поэтому я хочу собрать их вместе. Скажем, если я сохраняю все логические значения в виде __m128i ...
Меня путает вектор AND в наборе инструкций AVX. Я использую intrinsics, для которых кандидаты: __m256 _mm256_and_ps (__m256 a, __m256 b) (AVX) __m256i _mm256_and_si256 (...
Я хотел бы запустить и играть с некоторым AVX (усовершенствованное векторное расширение) инструкции. Я знаю, что Intel обеспечивает эмулятор для тестирования программного обеспечения, содержащего эти инструкции (см. этот вопрос), но так как я надеваю'...
Мой процессор поддерживает следующие технологии: MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2 и AVX. Когда я пишу свой код и проверяю аппаратную поддержку, могу ли я предположить такие вещи, как «Если процессор ...
У меня есть часть кода, которая делает это: __m128i a = _mm_loadl_pi (a, (__m64 *) ptr); Где ptr - некоторый адрес памяти. Я получаю предупреждение компилятора о том, что оно используется в его собственной инициализации. По существу ...
Поскольку Intel CPUS имеет набор инструкций AVX, который использует регистры XMM размером 256/512 байт для выполнения векторной операции с данными. Поддерживает ли Nvidia любую такую векторную операцию, я хотел бы работать с 128 / ...
Я нахожу трудности в создании кода для этой, казалось бы, легкой проблемы. Учитывая упакованное 8-битное целое число, замените один байт другим, если он присутствует. Например, я хочу заменить 0x06 ...
У меня есть результат сравнения двух векторов __m256. __m256 result = _mm256_cmp_ps (a, b, _CMP_GT_OQ); В какой момент у меня есть векторный результат с 8 значениями. И каждое из этих значений ...
Кто-нибудь знает, как разрешить эти ошибки? Я пытаюсь добавить два 256-битных целочисленных векторов, но получаю следующую ошибку: cpu_avx.c: 12: 20: ошибка: несовместимые типы при инициализации типа «...
Есть ли какой-либо Intel AVX intrinsics библиотека? Я ищу что-то подобное как 'sse2mmx.h' заголовок, какие нейтрализации к MMX intrinsics, если целое число SSE2 intrinsics не доступно на времени компиляции...
Я новичок в TensorFlow. Я недавно установил его (версия ЦП Windows) и получил следующее сообщение: Успешно установлен tenorflow-1.4.0 tenorflow-tenorboard-0.4.0rc2 Затем, когда я ...
Обновление: пожалуйста, прочтите код, он НЕ о подсчете битов в одном int. Можно ли улучшить производительность следующего кода с помощью какого-нибудь умного ассемблера? uint bit_counter [64]; void Count (...
Intel Advanced Vector Extensions (AVX )не предлагает скалярного произведения в 256 -битной версии (регистр YMM )для переменных двойной точности с плавающей запятой. "Почему?" вопрос был рассмотрен очень кратко...
Я использую сборку MinGW64 на основе GCC 4.6.1 для 64-битной цели Windows. Я играюсь с новыми инструкциями Intel AVX. Мои аргументы командной строки: -march = corei7-avx -mtune = corei7-avx -mavx. ...
Я ищу SIMD математические библиотеки (желательно с открытым исходным кодом) для SSE и AVX. Я имею в виду, например, если у меня есть регистр AVX v с 8 значениями с плавающей запятой, я хочу, чтобы sin (v) возвращал грех всех восьми значений в ...
Я рассчитываю восемь точечных продуктов одновременно с AVX. В моем текущем коде я делаю что-то вроде этого (до развертывания): Ivy-Bridge / Sandy-Bridge __m256 areg0 = _mm256_set1_ps (a [m]); для (int i = 0; i
Я хотел бы объединить два значения __m128 в одно __m256. Примерно так: __m128 a = _mm_set_ps(1, 2, 3, 4);
__m128 b = _mm_set_ps(5, 6, 7, 8); что-то вроде: __m256 c = { 1, 2, 3, 4, ...
Я пытаюсь скомпилировать программу, использующую инструкцию pclmulqdq, присутствующую в новых процессорах Intel. Я установил GCC 4.6 с помощью macports, но когда я компилирую свою программу (использующую встроенный ...
Допустим ли следующий код для проверки, поддерживает ли ЦП набор инструкций SSE3? Использование функции IsProcessorFeaturePresent () явно не работает в Windows XP (см. Http: //msdn.microsoft.com / ...
Мне нужно выполнить операцию вращения с как можно меньшим количеством тактов. В первом случае предположим __m128i в качестве источника и типа назначения :источник :|| А0 || А1 || А2 || А3 || пункт назначения :|| А1 || А2 ||...
Когда я скомпилировал программу, которую писал на C++ (для последнего Macbook pro, который, конечно же, поддерживает набор инструкций AVX ), я получил следующие ошибки. Я использую последнюю версию g++, полученную...
Наряду с введением AVX Intel представила схему кодирования VEX в архитектуре Intel 64 и IA-32. Эта схема кодирования используется в основном с инструкциями AVX. Мне было интересно, если это...
Проблема может быть описана следующим образом. Вход __m256d a, b, c, d Выход __m256d s = {a[0]+a[1]+a[2]+a[3], b[0]+b[1]+b[2]+b [3], c[0]+c[1]+c[2]+c[3], d[0]+d[1]+d[2]+d[3]} Работа у меня есть...
Проблема
Существуют ли какие-либо вычислительно осуществимые подходы к внутрирегистративной дедупликации набора целых чисел с использованием инструкций simD x86? Пример
У нас есть 4-кортежный регистр R1 = {3,9, 2, 9} и ...
Мой код на C++ использует SSE, и теперь я хочу улучшить его для поддержки AVX, когда он доступен. Поэтому я определяю, когда AVX доступен, и вызываю функцию, которая использует команды AVX. Я использую Win7 SP1 + VS2010 SP1 и ...
Как с помощью Delphi 2007 проверить, поддерживает ли бокс AVX. Мой вопрос ограничивается только запросом поддержки в ЦП (предполагается, что ОС в порядке / Windows 7 с пакетом обновления 1). PDF...
У меня есть вектор __m256d, упакованный четырьмя 64-битными значениями с плавающей запятой .
Мне нужно найти горизонтальный максимум элементов вектора и сохранить результат в скалярном значении двойной точности; Мой...
У меня есть упакованный вектор из четырех 64-битных значений с плавающей запятой.
Я хотел бы получить сумму элементов вектора. С SSE (и с использованием 32-битных чисел с плавающей запятой) я мог просто сделать следующее: v_sum = ...
Мне нужна функция Переменная __m128i с периодом 2 ^ 128. Ей не нужно монотонно увеличиваться (как счетчик), но нужно посещать каждое значение один раз. Самый простой пример, который я мог придумать, на самом деле ...