5
ответов

Обратное указание _mm_movemask_epi8 [duplicate]

У меня есть массив логических и вы хотите отправить их через сеть. Тем не менее, я только хочу отправить один бит за логическое значение, поэтому я хочу собрать их вместе. Скажем, если я сохраняю все логические значения в виде __m128i ...
вопрос задан: 7 February 2014 10:50
3
ответа

Почему вектор AVX и операция принимают float-векторы? [Дубликат]

Меня путает вектор AND в наборе инструкций AVX. Я использую intrinsics, для которых кандидаты: __m256 _mm256_and_ps (__m256 a, __m256 b) (AVX) __m256i _mm256_and_si256 (...
вопрос задан: 11 June 2015 21:27
2
ответа

Какие ассемблеры в настоящее время поддерживают систему команд AVX?

Я хотел бы запустить и играть с некоторым AVX (усовершенствованное векторное расширение) инструкции. Я знаю, что Intel обеспечивает эмулятор для тестирования программного обеспечения, содержащего эти инструкции (см. этот вопрос), но так как я надеваю'...
вопрос задан: 23 May 2017 10:25
2
ответа

Какие расширения x86 ISA подразумевают поддержку предыдущих расширений SIMD? [Дубликат]

Мой процессор поддерживает следующие технологии: MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2 и AVX. Когда я пишу свой код и проверяю аппаратную поддержку, могу ли я предположить такие вещи, как «Если процессор ...
вопрос задан: 18 July 2015 11:50
2
ответа

Использование intrinsics в их собственной инициализации [duplicate]

У меня есть часть кода, которая делает это: __m128i a = _mm_loadl_pi (a, (__m64 *) ptr); Где ptr - некоторый адрес памяти. Я получаю предупреждение компилятора о том, что оно используется в его собственной инициализации. По существу ...
вопрос задан: 11 September 2013 15:28
2
ответа

Операции с вектором, поддерживаемые в Hardware от Nvidia GPUS [дубликат]

Поскольку Intel CPUS имеет набор инструкций AVX, который использует регистры XMM размером 256/512 байт для выполнения векторной операции с данными. Поддерживает ли Nvidia любую такую ​​векторную операцию, я хотел бы работать с 128 / ...
вопрос задан: 8 March 2011 22:48
1
ответ

Заменить байт другим

Я нахожу трудности в создании кода для этой, казалось бы, легкой проблемы. Учитывая упакованное 8-битное целое число, замените один байт другим, если он присутствует. Например, я хочу заменить 0x06 ...
вопрос задан: 15 January 2019 15:32
1
ответ

Самый быстрый способ проверить, не имеет ли какой-либо элемент в __m256 [duplicate]

У меня есть результат сравнения двух векторов __m256. __m256 result = _mm256_cmp_ps (a, b, _CMP_GT_OQ); В какой момент у меня есть векторный результат с 8 значениями. И каждое из этих значений ...
вопрос задан: 8 March 2015 11:57
1
ответ

Ошибка команды AVX для целочисленного добавления [дубликат]

Кто-нибудь знает, как разрешить эти ошибки? Я пытаюсь добавить два 256-битных целочисленных векторов, но получаю следующую ошибку: cpu_avx.c: 12: 20: ошибка: несовместимые типы при инициализации типа «...
вопрос задан: 9 July 2013 17:20
1
ответ

Intel AVX intrinsics: какая-либо библиотека совместимости?

Есть ли какой-либо Intel AVX intrinsics библиотека? Я ищу что-то подобное как 'sse2mmx.h' заголовок, какие нейтрализации к MMX intrinsics, если целое число SSE2 intrinsics не доступно на времени компиляции...
вопрос задан: 25 April 2010 15:49
0
ответов

Ваш процессор поддерживает инструкции, которые этот двоичный файл TensorFlow не был скомпилирован для использования: AVX AVX2

Я новичок в TensorFlow. Я недавно установил его (версия ЦП Windows) и получил следующее сообщение: Успешно установлен tenorflow-1.4.0 tenorflow-tenorboard-0.4.0rc2 Затем, когда я ...
вопрос задан: 3 April 2019 14:17
0
ответов

Как быстро подсчитать биты в отдельные ячейки в серии целых на Sandy Bridge? [дубликат]

Обновление: пожалуйста, прочтите код, он НЕ о подсчете битов в одном int. Можно ли улучшить производительность следующего кода с помощью какого-нибудь умного ассемблера? uint bit_counter [64]; void Count (...
вопрос задан: 29 April 2018 06:37
0
ответов

Intel AVX :256 -версия скалярного произведения для переменных двойной точности с плавающей запятой

Intel Advanced Vector Extensions (AVX )не предлагает скалярного произведения в 256 -битной версии (регистр YMM )для переменных двойной точности с плавающей запятой. "Почему?" вопрос был рассмотрен очень кратко...
вопрос задан: 17 November 2017 23:34
0
ответов

Как выровнять стек по 32 байтам Граница в GCC?

Я использую сборку MinGW64 на основе GCC 4.6.1 для 64-битной цели Windows. Я играюсь с новыми инструкциями Intel AVX. Мои аргументы командной строки: -march = corei7-avx -mtune = corei7-avx -mavx. ...
вопрос задан: 7 November 2017 14:53
0
ответов

SIMD математические библиотеки для SSE и AVX

Я ищу SIMD математические библиотеки (желательно с открытым исходным кодом) для SSE и AVX. Я имею в виду, например, если у меня есть регистр AVX v с 8 значениями с плавающей запятой, я хочу, чтобы sin (v) возвращал грех всех восьми значений в ...
вопрос задан: 23 May 2017 12:25
0
ответов

Развертывание цикла для достижения максимальной пропускной способности с Ivy Bridge и Haswell

Я рассчитываю восемь точечных продуктов одновременно с AVX. В моем текущем коде я делаю что-то вроде этого (до развертывания): Ivy-Bridge / Sandy-Bridge __m256 areg0 = _mm256_set1_ps (a [m]); для (int i = 0; i
вопрос задан: 23 May 2017 12:17
0
ответов

Как объединить два значения __m128 в __m256?

Я хотел бы объединить два значения __m128 в одно __m256. Примерно так: __m128 a = _mm_set_ps(1, 2, 3, 4); __m128 b = _mm_set_ps(5, 6, 7, 8); что-то вроде: __m256 c = { 1, 2, 3, 4, ...
вопрос задан: 23 December 2016 04:49
0
ответов

Как использовать AVX/pclmulqdq в Mac OS X

Я пытаюсь скомпилировать программу, использующую инструкцию pclmulqdq, присутствующую в новых процессорах Intel. Я установил GCC 4.6 с помощью macports, но когда я компилирую свою программу (использующую встроенный ...
вопрос задан: 16 June 2016 07:10
0
ответов

Как проверить, поддерживает ли ЦП набор инструкций SSE3?

Допустим ли следующий код для проверки, поддерживает ли ЦП набор инструкций SSE3? Использование функции IsProcessorFeaturePresent () явно не работает в Windows XP (см. Http: //msdn.microsoft.com / ...
вопрос задан: 9 April 2013 08:30
0
ответов

Как повернуть вектор SSE/AVX

Мне нужно выполнить операцию вращения с как можно меньшим количеством тактов. В первом случае предположим __m128i в качестве источника и типа назначения :источник :|| А0 || А1 || А2 || А3 || пункт назначения :|| А1 || А2 ||...
вопрос задан: 6 December 2012 13:13
0
ответов

g++ :Нет такой инструкции с AVX

Когда я скомпилировал программу, которую писал на C++ (для последнего Macbook pro, который, конечно же, поддерживает набор инструкций AVX ), я получил следующие ошибки. Я использую последнюю версию g++, полученную...
вопрос задан: 18 August 2012 06:04
0
ответов

Можно ли смешивать устаревшие инструкции в кодировке SSE и инструкции в кодировке VEX в одном и том же кодовом пути?

Наряду с введением AVX Intel представила схему кодирования VEX в архитектуре Intel 64 и IA-32. Эта схема кодирования используется в основном с инструкциями AVX. Мне было интересно, если это...
вопрос задан: 2 June 2012 21:21
0
ответов

4 горизонтальные суммы двойной точности за один раз с помощью AVX

Проблема может быть описана следующим образом. Вход __m256d a, b, c, d Выход __m256d s = {a[0]+a[1]+a[2]+a[3], b[0]+b[1]+b[2]+b [3], c[0]+c[1]+c[2]+c[3], d[0]+d[1]+d[2]+d[3]} Работа у меня есть...
вопрос задан: 31 May 2012 13:29
0
ответов

Предоставляет ли .NET Framework 4.5 поддержку SSE4/AVX?

Кажется, я слышал об этом, но не знаю, где. upd: Я рассказывал про JiT
вопрос задан: 27 May 2012 18:31
0
ответов

Выберите уникальную/дедупликацию в SSE/AVX

Проблема Существуют ли какие-либо вычислительно осуществимые подходы к внутрирегистративной дедупликации набора целых чисел с использованием инструкций simD x86? Пример У нас есть 4-кортежный регистр R1 = {3,9, 2, 9} и ...
вопрос задан: 25 May 2012 07:54
0
ответов

Использование инструкций процессора AVX: Низкая производительность без "/arch:AVX"

Мой код на C++ использует SSE, и теперь я хочу улучшить его для поддержки AVX, когда он доступен. Поэтому я определяю, когда AVX доступен, и вызываю функцию, которая использует команды AVX. Я использую Win7 SP1 + VS2010 SP1 и ...
вопрос задан: 5 April 2012 14:51
0
ответов

Как проверить наличие расширенных векторных расширений Intel®?

Как с помощью Delphi 2007 проверить, поддерживает ли бокс AVX. Мой вопрос ограничивается только запросом поддержки в ЦП (предполагается, что ОС в порядке / Windows 7 с пакетом обновления 1). PDF...
вопрос задан: 3 April 2012 07:09
0
ответов

Как найти горизонтальный максимум в 256-битном векторе AVX

У меня есть вектор __m256d, упакованный четырьмя 64-битными значениями с плавающей запятой . Мне нужно найти горизонтальный максимум элементов вектора и сохранить результат в скалярном значении двойной точности; Мой...
вопрос задан: 20 March 2012 21:48
0
ответов

Самый быстрый способ суммирования горизонтальных векторов с инструкциями AVX [дубликат]

У меня есть упакованный вектор из четырех 64-битных значений с плавающей запятой. Я хотел бы получить сумму элементов вектора. С SSE (и с использованием 32-битных чисел с плавающей запятой) я мог просто сделать следующее: v_sum = ...
вопрос задан: 19 March 2012 18:20
0
ответов

128-битный счетчик SSE?

Мне нужна функция Переменная __m128i с периодом 2 ^ 128. Ей не нужно монотонно увеличиваться (как счетчик), но нужно посещать каждое значение один раз. Самый простой пример, который я мог придумать, на самом деле ...
вопрос задан: 19 February 2012 12:03