0
ответов

Набор инструкций SSE не включен

У меня проблема с этой ошибкой: «Набор инструкций SSE не включен». Как я могу это выяснить? У меня ACER i7, Ubuntu 11.10, пожалуйста, кто-нибудь может мне помочь? Любая помощь будет принята с благодарностью! Также .. .
вопрос задан: 27 October 2016 00:50
0
ответов

Использование внутренней прагмы (sqrt, pow) в C #?

Резюме по C ++ Использование внутренней команды #pragma в секции препроцессора вашего кода значительно увеличить скорость большинства вызовов математических функций. #pragma intrinsic (sqrt, pow) Приведенный выше код ...
вопрос задан: 22 June 2016 11:27
0
ответов

Оптимизация кода SSE2

Я использую встроенные функции SSE2 для оптимизации узких мест моего приложения и задаю следующий вопрос : ddata = _mm_xor_si128 (_mm_xor_si128 (_mm_sll_epi32 (xdata, 0x7u), _mm_srl_epi32 (tdata, ...
вопрос задан: 19 May 2016 05:54
0
ответов

Когда JVM будет использовать встроенные функции

Почему определенные шаблоны кода, когда они присутствуют во внутренних классах JVM, превращаются в встроенную функцию, тогда как те же шаблоны при вызове из моего собственного класса - нет. Пример: bitCount ...
вопрос задан: 19 March 2016 18:30
0
ответов

Доступ к произвольным 16-битным элементам, упакованным в 128-битный регистр

С помощью встроенных функций компилятора Intel, учитывая 128-битный регистр, упаковывающий 8 16-битных элементов, как я могу получить доступ (дешево) к произвольным элементам из регистр, для последующего использования _mm_cvtepi8_epi64 (...
вопрос задан: 16 September 2015 14:55
0
ответов

Возможна «собственная внутренняя» функция для x64 вместо встроенной сборки?

В настоящее время я экспериментирую с созданием высокооптимизированных многоразовых функций для моей библиотеки. Например, я пишу функцию "степень двойки" следующим образом: template
вопрос задан: 18 February 2015 15:47
0
ответов

Загрузить 8-битный uint8_t как uint32_t?

Мой проект обработки изображений работает с изображениями в градациях серого. У меня процессорная платформа ARM Cortex-A8. Я хочу использовать НЕОН. У меня есть изображение в градациях серого (рассмотрим пример ниже), и в моем ...
вопрос задан: 10 April 2014 15:30
0
ответов

Как повернуть вектор SSE/AVX

Мне нужно выполнить операцию вращения с как можно меньшим количеством тактов. В первом случае предположим __m128i в качестве источника и типа назначения :источник :|| А0 || А1 || А2 || А3 || пункт назначения :|| А1 || А2 ||...
вопрос задан: 6 December 2012 13:13
0
ответов

Использование встроенных функций ARM NEON для добавления альфы и перестановки

Я разрабатываю приложение для iOS, которое должно довольно быстро преобразовывать изображения из RGB -> BGRA. Я хотел бы использовать встроенные функции NEON, если это возможно. Есть ли более быстрый способ, чем простое назначение компонентов?...
вопрос задан: 9 August 2012 19:56
0
ответов

Как я должен передавать данные SSE своим функциям/операторам?

Я пишу пару классов-оболочек для SSE Intrinsics -, в основном для того, чтобы получить тип -безопасных геометрических операций, а также для добавления пары удобных функций. Все мои функции и операторы встроены....
вопрос задан: 9 August 2012 07:59
0
ответов

Моделирование функциональности packusdw с помощью SSE2

Я реализую функцию быстрого преобразования x888 -> 565 пикселей в pixman по алгоритму, описанному Intel [ пдф]. Их код преобразует x888 -> 555, а я хочу преобразовать в 565. ...
вопрос задан: 14 June 2012 07:47
0
ответов

Как эффективно определить 128-битную константу?

Я работаю с набором инструкций SSE2 в MS Visual Studio. Я использую его для некоторых вычислений с 16-битными данными. Предположим, у меня есть 8 значений, загруженных в регистр SSE. Я хочу добавить константу (например...
вопрос задан: 3 June 2012 20:13
0
ответов

Преобразование между SSE и NEON Intrinsics-Shuffling

Я пытаюсь преобразовать код, написанный на встроенных функциях SSE3, в NEON SIMD и застрял из-за функции перемешивания. Я просмотрел встроенные функции GCC, руководства ARM и другие форумы но не было ...
вопрос задан: 14 May 2012 22:02
0
ответов

Проверить регистр XMM на наличие всех нулей

Есть ли способ проверить, равны ли 0 все биты/байты/слова и т. д. в переменной __m128i? В моем приложении я должен проверить, являются ли все целые числа, упакованные в переменную __m128i, нулями. Придется ли мне извлекать их...
вопрос задан: 16 April 2012 17:54
0
ответов

Как я могу получить встроенную функцию для функции exp ()в коде x64?

У меня есть следующий код, и я ожидаю, что будет использоваться встроенная версия функции exp (). К сожалению, это не сборка x64, что делает ее медленнее аналогичной сборки Win32 (, т.е. 32-разрядной -сборки ):....
вопрос задан: 11 April 2012 02:35
0
ответов

128-битный счетчик SSE?

Мне нужна функция Переменная __m128i с периодом 2 ^ 128. Ей не нужно монотонно увеличиваться (как счетчик), но нужно посещать каждое значение один раз. Самый простой пример, который я мог придумать, на самом деле ...
вопрос задан: 19 February 2012 12:03
0
ответов

Visual C++ x64 add with carry

Поскольку для ADC, похоже, не существует intrinsic, и я не могу использовать inline assembler для архитектуры x64 с Visual C++, что мне делать, если я хочу написать функцию, использующую add with carry, но ...
вопрос задан: 11 February 2012 16:02
0
ответов

SSE intrinsics cause normal float operation to return -1.#INV

У меня проблема с SSE методом, который я пишу и который выполняет обработку звука. Я реализовал случайную функцию SSE, основанную на статье Intel здесь: http://software.intel.com/en-us/articles/...
вопрос задан: 29 January 2012 10:59
0
ответов

Используйте встроенные функции SSE2 и встроенный ассемблер gcc

Я попытался совместить встроенные функции SSE2 и встроенный ассемблер в gcc. Но если я укажу переменную как xmm0 / register в качестве входных данных, в некоторых случаях я получаю ошибку компилятора. Пример: #include ...
вопрос задан: 27 January 2012 21:33
0
ответов

Внутренние функции SSE - сравнение, если / иначе оптимизация

Я пытался оптимизировать некоторый код, который обрабатывает необработанные данные пикселей. В настоящее время реализация кода на C ++ работает слишком медленно, поэтому я пытался обосновать использование встроенных функций SSE (SSE / 2/3 ...
вопрос задан: 24 January 2012 12:27
0
ответов

Эквивалент _mm_alignr_epi8 (PALIGNR) в AVX2

В SSE3 инструкция PALIGNR выполняет следующее: PALIGNR объединяет целевой операнд (первый операнд) и исходный операнд (второй операнд) в промежуточную композицию, ...
вопрос задан: 15 December 2011 10:05
0
ответов

Как выполнить операцию с матрицей 8 x 8 с помощью SSE?

Моя первая попытка выглядела так (предположительно, мы хотим умножить) __m128 mat [n]; / * строки * / __m128 vec [n] = {1,1,1,1}; float outvector [n]; for (int row = 0; row
вопрос задан: 27 November 2011 15:39
0
ответов

Как _mm_mwait работает?

Как делает _mm_mwait от работы pmmintrin.h? (Я имею в виду не asm для него, но действие и как эти меры приняты в системах NUMA. Контроль хранилища легко реализовать только в основанных на шине системах SMP...
вопрос задан: 8 October 2011 13:12
0
ответов

Как лучше всего загрузить 2 невыровненных 64-битных значения в регистр sse с SSSE3?

Есть 2 указателя на 2 невыровненных 8-байтовых фрагмента, которые должны быть загружены в регистр xmm. Если возможно, с использованием встроенных функций. И, если возможно, без использования вспомогательного регистра. Без pinsrd. (SSSE Core 2 )
вопрос задан: 27 August 2011 23:16
0
ответов

SIMD intrintsekoentzako erreferentzia eskuliburua / tutoriala? [itxita]

Hauek kode batzuen errendimendua hobetzeko erabiltzea aztertzen ari naiz, baina dokumentazio ona zaila dela dirudi * mmintrin.h goiburuetan definitutako funtzioetarako, inork emango al dit ...
вопрос задан: 6 August 2011 08:57
0
ответов

макс. x86 / минута asm инструкции?

Есть ли какие-либо asm инструкции, которые могут ускорить вычисление минуты / макс. из вектора удваивается/целым числа на архитектуре Core i7? Обновление: Я не ожидал такие богатые ответы, спасибо. Таким образом, я вижу это макс./...
вопрос задан: 5 July 2011 03:39
0
ответов

оператор if / else во встроенных функциях SSE

Я пытаюсь оптимизировать небольшой фрагмент кода с помощью SSE intrinsics (я полный новичок в этой теме), но я немного зациклился на использовании условных выражений. Мой исходный код: unsigned long c; ...
вопрос задан: 9 June 2011 10:25
0
ответов

Билинейный фильтр со встроенными функциями SSE4.1

Я пытаюсь найти достаточно быструю функцию билинейной фильтрации только для одной отфильтрованной выборки за раз, поскольку упражнение по привыканию к использованию встроенных функций - до SSE41 вполне подойдет. Пока я ...
вопрос задан: 11 May 2011 09:57
0
ответов

Как компиляторы обрабатывают встроенные функции SSE (или любые другие)?

Некоторое время назад я где-то читал, что встроенные функции SSE компилируются в эффективный машинный код, потому что компиляторы обрабатывают их иначе, чем обычные функции. Я брожу, как на самом деле делают компиляторы ...
вопрос задан: 15 April 2011 14:43
0
ответов

Получаю ли я снижение производительности при смешивании инструкций SSE integer / float SIMD

Я использовал инструкции SIMD x86 (SSE1234) в вид встроенных элементов довольно много в последнее время. Что меня расстраивает, так это то, что SSE ISA имеет несколько простых инструкций, доступных только для чисел с плавающей запятой ...
вопрос задан: 16 February 2011 21:16