У меня проблема с этой ошибкой: «Набор инструкций SSE не включен». Как я могу это выяснить? У меня ACER i7, Ubuntu 11.10, пожалуйста, кто-нибудь может мне помочь? Любая помощь будет принята с благодарностью! Также .. .
Резюме по C ++ Использование внутренней команды #pragma в секции препроцессора вашего кода значительно увеличить скорость большинства вызовов математических функций. #pragma intrinsic (sqrt, pow) Приведенный выше код ...
Я использую встроенные функции SSE2 для оптимизации узких мест моего приложения и задаю следующий вопрос : ddata = _mm_xor_si128 (_mm_xor_si128 (_mm_sll_epi32 (xdata, 0x7u), _mm_srl_epi32 (tdata, ...
Почему определенные шаблоны кода, когда они присутствуют во внутренних классах JVM, превращаются в встроенную функцию, тогда как те же шаблоны при вызове из моего собственного класса - нет. Пример: bitCount ...
С помощью встроенных функций компилятора Intel, учитывая 128-битный регистр, упаковывающий 8 16-битных элементов, как я могу получить доступ (дешево) к произвольным элементам из регистр, для последующего использования _mm_cvtepi8_epi64 (...
В настоящее время я экспериментирую с созданием высокооптимизированных многоразовых функций для моей библиотеки. Например, я пишу функцию "степень двойки" следующим образом: template
Мой проект обработки изображений работает с изображениями в градациях серого. У меня процессорная платформа ARM Cortex-A8. Я хочу использовать НЕОН. У меня есть изображение в градациях серого (рассмотрим пример ниже), и в моем ...
Мне нужно выполнить операцию вращения с как можно меньшим количеством тактов. В первом случае предположим __m128i в качестве источника и типа назначения :источник :|| А0 || А1 || А2 || А3 || пункт назначения :|| А1 || А2 ||...
Я разрабатываю приложение для iOS, которое должно довольно быстро преобразовывать изображения из RGB -> BGRA. Я хотел бы использовать встроенные функции NEON, если это возможно. Есть ли более быстрый способ, чем простое назначение компонентов?...
Я пишу пару классов-оболочек для SSE Intrinsics -, в основном для того, чтобы получить тип -безопасных геометрических операций, а также для добавления пары удобных функций. Все мои функции и операторы встроены....
Я реализую функцию быстрого преобразования x888 -> 565 пикселей в pixman по алгоритму, описанному Intel [ пдф]. Их код преобразует x888 -> 555, а я хочу преобразовать в 565. ...
Я работаю с набором инструкций SSE2 в MS Visual Studio. Я использую его для некоторых вычислений с 16-битными данными. Предположим, у меня есть 8 значений, загруженных в регистр SSE. Я хочу добавить константу (например...
Я пытаюсь преобразовать код, написанный на встроенных функциях SSE3, в NEON SIMD и застрял из-за функции перемешивания. Я просмотрел встроенные функции GCC, руководства ARM и другие форумы но не было ...
Есть ли способ проверить, равны ли 0 все биты/байты/слова и т. д. в переменной __m128i? В моем приложении я должен проверить, являются ли все целые числа, упакованные в переменную __m128i, нулями. Придется ли мне извлекать их...
У меня есть следующий код, и я ожидаю, что будет использоваться встроенная версия функции exp (). К сожалению, это не сборка x64, что делает ее медленнее аналогичной сборки Win32 (, т.е. 32-разрядной -сборки ):....
Мне нужна функция Переменная __m128i с периодом 2 ^ 128. Ей не нужно монотонно увеличиваться (как счетчик), но нужно посещать каждое значение один раз. Самый простой пример, который я мог придумать, на самом деле ...
Поскольку для ADC, похоже, не существует intrinsic, и я не могу использовать inline assembler для архитектуры x64 с Visual C++, что мне делать, если я хочу написать функцию, использующую add with carry, но ...
У меня проблема с SSE методом, который я пишу и который выполняет обработку звука. Я реализовал случайную функцию SSE, основанную на статье Intel здесь: http://software.intel.com/en-us/articles/...
Я попытался совместить встроенные функции SSE2 и встроенный ассемблер в gcc. Но если я укажу переменную как xmm0 / register в качестве входных данных, в некоторых случаях я получаю ошибку компилятора. Пример: #include
...
Я пытался оптимизировать некоторый код, который обрабатывает необработанные данные пикселей. В настоящее время реализация кода на C ++ работает слишком медленно, поэтому я пытался обосновать использование встроенных функций SSE (SSE / 2/3 ...
Как делает _mm_mwait от работы pmmintrin.h? (Я имею в виду не asm для него, но действие и как эти меры приняты в системах NUMA. Контроль хранилища легко реализовать только в основанных на шине системах SMP...
Есть 2 указателя на 2 невыровненных 8-байтовых фрагмента, которые должны быть загружены в регистр xmm. Если возможно, с использованием встроенных функций. И, если возможно, без использования вспомогательного регистра. Без pinsrd. (SSSE Core 2 )
Hauek kode batzuen errendimendua hobetzeko erabiltzea aztertzen ari naiz, baina dokumentazio ona zaila dela dirudi * mmintrin.h goiburuetan definitutako funtzioetarako, inork emango al dit ...
Есть ли какие-либо asm инструкции, которые могут ускорить вычисление минуты / макс. из вектора удваивается/целым числа на архитектуре Core i7? Обновление: Я не ожидал такие богатые ответы, спасибо. Таким образом, я вижу это макс./...
Я пытаюсь оптимизировать небольшой фрагмент кода с помощью SSE intrinsics (я полный новичок в этой теме), но я немного зациклился на использовании условных выражений. Мой исходный код: unsigned long c;
...
Я пытаюсь найти достаточно быструю функцию билинейной фильтрации только для одной отфильтрованной выборки за раз, поскольку упражнение по привыканию к использованию встроенных функций - до SSE41 вполне подойдет. Пока я ...
Некоторое время назад я где-то читал, что встроенные функции SSE компилируются в эффективный машинный код, потому что компиляторы обрабатывают их иначе, чем обычные функции. Я брожу, как на самом деле делают компиляторы ...
Я использовал инструкции SIMD x86 (SSE1234) в вид встроенных элементов довольно много в последнее время. Что меня расстраивает, так это то, что SSE ISA имеет несколько простых инструкций, доступных только для чисел с плавающей запятой ...