Проблема может быть описана следующим образом. Вход __m256d a, b, c, d Выход __m256d s = {a[0]+a[1]+a[2]+a[3], b[0]+b[1]+b[2]+b [3], c[0]+c[1]+c[2]+c[3], d[0]+d[1]+d[2]+d[3]} Работа у меня есть...
Недавно я опубликовал вопрос о накладных расходах памяти из-за виртуальности в C++. Ответы позволяют мне понять, как работают vtable и vptr.
Моя проблема заключается в следующем: я работаю на суперкомпьютерах, я...
Всякий раз, когда я использую свой Bluetooth на своем ноутбуке, что почти всегда, так как я использую мышь Bluetooth, моя скорость интернета падает до 1 МБ / с на интернет-панели и почти ничего не загружается. Я использую iwlwifi ...
Определенные рабочие нагрузки типа DSP показывают очень значительное улучшение производительности на процессорах Intel x86 x86_64 при подключении к библиотеке Intel IPP. Интересно, есть ли что-то подобное на ARM...
Я пытаюсь собрать информацию о системе и заметил следующее на Intel Xeon E5420 :После выполнения CPUID (EAX=1 )устанавливается EDX[28], что указывает на поддержку многопоточности Hyper -, несмотря на то, что...
В моем приложении есть ядро с множественным добавлением, и я хочу повысить его производительность. Я использую Intel Core i7-960 (тактовая частота 3,2 ГГц) и уже вручную внедрил ядро с помощью SSE...
Я занимался программированием на ассемблере для ARM и хотел бы изучить Intel Assembler. Я продолжаю слышать все эти различные упоминания Ж/М/С/МЗ-, но я не уверен, как они соотносятся с тем, чего я хочу достичь?...
Я пишу компилятор и должен вывести код для условий ветвления для значений с плавающей запятой. Например, для компиляции такого кода: if(a <= b){ //1. Сделай что-нибудь
} иначе { //2. Сделайте...
Мне интересно, можно ли запрограммировать TPM ( http://en.wikipedia.org/wiki/Trusted_Platform_Module) присутствует в большинстве микросхем Intel таким образом, чтобы: - решить, что хранить в постоянном ...
Я сейчас изучаю ассемблер для процессоров Intel.
Поскольку стек "растет вниз", почему мы должны добавлять для доступа к определенному элементу [ebp + 8] ;; Это даст доступ к первому параметру, который я знаю ...
Когда я компилирую приложение с помощью компилятора Intel, оно работает медленнее, чем когда я компилирую его с помощью GCC. Вывод компилятора Intel более чем в 2 раза медленнее. Приложение содержит несколько вложенных циклов. Are ...
Я использовал онлайн для измерения производительности SSE. #ifndef __TIMER_H __
# define __TIMER_H__ #pragma warning (push)
# pragma warning (disable: 4035) // отключить предупреждение об отсутствии возвращаемого значения __forceinline ...
В 64-bit IDT Gate Descriptor от Intel есть Segment Selector. Однако, насколько я понял из 5 частей руководства Intel, линейный адрес обработчика прерываний загружается в RIP из ...
Современные процессоры имеют довольно множество счетчиков производительности - http://www.intel.com/content/www/us/en/architecture-and-technology/64-ia-32-architectures-software-developer-system-programming-manual-325384 .. ..
Мой вопрос не о GPGPU. Я достаточно хорошо понимаю GPGPU, и это не то, что я ищу. Предполагается, что у Intel Sand Bridge есть некоторые функции, которые позволяют напрямую выполнять ...
Мне было интересно сделать проект о распознавании лиц (чтобы использовать набор инструкций SIMD). Но в течение первого семестра текущего года я кое-что узнал о потоках, и я был ...
Я нашел этот абзац в руководстве разработчика Intel: Из главы «ПРОГРАММИРОВАНИЕ С SSE3, SSSE3, SSE4 И AESNI» Потоковая загрузка не должна использоваться для обращения к адресам памяти, которые ...
Мне было интересно, есть ли способ использовать новый аппаратный генератор истинных чисел, который есть в процессоре Intel Sandy Bridge? Я читал, что Intel MKL (Math Kernel Library) раскрывает это ...
Опция Gcc -fdump-tree-optimized сбрасывает оптимизированную версию вашего кода C в файл C. Есть ли способ сделать то же самое с помощью компилятора intel icc? У меня есть код матричного умножения, который я ...
Здесь очень простой вопрос ... Я пытаюсь обернуть Я схожу с ума по ассемблеру и мне интересно, эквивалентны ли эти операции: mov [ebx], 5 и lea esi, ebx
mov esi, 5 Спасибо!
У меня возникла загадочная ошибка при загрузке файлов Vorbis Ogg на Mac OSX. Первый файл загружается правильно, второй падает в каком-то коде, который указывает, что файл поврежден, то же самое происходит, даже если я загружаю ...
Что нужно для написания некоторого уровня абстракции для оборудования Intel IPT? Для тех, кто не знаком с Intel IPT, это встроенный сопроцессор, используемый для генерации уникальных 6-символьных одноразовых…
Итак, X86-64 имеет RIP-относительные адреса, которые облегчают пишу коды, которые легко писать, и перемещение требуется гораздо меньше. Почему перемещения все еще нужны тогда на X86-64? Для каких особенностей? Я могу попытаться исследовать ...
мне любопытно знать, как можно было бы кодировать параллельное программное обеспечение на блоке Intel x86. Оба потока или сопрограммы с получением интересны. Я понимаю, что это не практично, чтобы сделать в блоке, но я...
У меня есть процессор Xeon W3550, который должен поддерживать набор инструкций SSE4.2, но когда я попробуйте использовать что-нибудь за SSE2 в моей программе c, я получаю ошибку компилятора, например #error "SSE4.2 ...
Все процессоры Intel за последнее десятилетие (по крайней мере) включают набор мониторов производительности, которые подсчитывают различные события. Обеспечивают ли новейшие процессоры Intel, Core i3, i5 и i7 (также известные как Nehalem) механизм ...