0
ответов

4 горизонтальные суммы двойной точности за один раз с помощью AVX

Проблема может быть описана следующим образом. Вход __m256d a, b, c, d Выход __m256d s = {a[0]+a[1]+a[2]+a[3], b[0]+b[1]+b[2]+b [3], c[0]+c[1]+c[2]+c[3], d[0]+d[1]+d[2]+d[3]} Работа у меня есть...
вопрос задан: 31 May 2012 13:29
0
ответов

C++/compilation: is it можно установить размер vptr (глобальная vtable + 2 байта индекса)

Недавно я опубликовал вопрос о накладных расходах памяти из-за виртуальности в C++. Ответы позволяют мне понять, как работают vtable и vptr. Моя проблема заключается в следующем: я работаю на суперкомпьютерах, я...
вопрос задан: 12 May 2012 08:50
0
ответов

все значения списка одинаковы [дубликат]

Есть ли простой способ в Python проверить, что все значения в списке равны друг другу?
вопрос задан: 11 May 2012 19:38
0
ответов

Проблемы с Wi-Fi при использовании Bluetooth на моем ноутбуке [закрыто]

Всякий раз, когда я использую свой Bluetooth на своем ноутбуке, что почти всегда, так как я использую мышь Bluetooth, моя скорость интернета падает до 1 МБ / с на интернет-панели и почти ничего не загружается. Я использую iwlwifi ...
вопрос задан: 8 May 2012 19:13
0
ответов

Существует ли эквивалент Intel IPP для ARM?

Определенные рабочие нагрузки типа DSP показывают очень значительное улучшение производительности на процессорах Intel x86 x86_64 при подключении к библиотеке Intel IPP. Интересно, есть ли что-то подобное на ARM...
вопрос задан: 7 May 2012 08:00
0
ответов

Почему многопоточность Hyper -сообщается как поддерживаемая на процессорах без нее?

Я пытаюсь собрать информацию о системе и заметил следующее на Intel Xeon E5420 :После выполнения CPUID (EAX=1 )устанавливается EDX[28], что указывает на поддержку многопоточности Hyper -, несмотря на то, что...
вопрос задан: 3 May 2012 19:36
0
ответов

Производительность циклов кода C

В моем приложении есть ядро ​​с множественным добавлением, и я хочу повысить его производительность. Я использую Intel Core i7-960 (тактовая частота 3,2 ГГц) и уже вручную внедрил ядро ​​с помощью SSE...
вопрос задан: 1 May 2012 04:17
0
ответов

АСМ:МАСМ, НАСМ, ФАСМ?

Я занимался программированием на ассемблере для ARM и хотел бы изучить Intel Assembler. Я продолжаю слышать все эти различные упоминания Ж/М/С/МЗ-, но я не уверен, как они соотносятся с тем, чего я хочу достичь?...
вопрос задан: 16 April 2012 18:55
0
ответов

Как лучше всего выполнить ветвление с помощью Intel SSE?

Я пишу компилятор и должен вывести код для условий ветвления для значений с плавающей запятой. Например, для компиляции такого кода: if(a <= b){ //1. Сделай что-нибудь } иначе { //2. Сделайте...
вопрос задан: 4 March 2012 20:13
0
ответов

Можно ли запрограммировать модуль доверенной платформы Intel

Мне интересно, можно ли запрограммировать TPM ( http://en.wikipedia.org/wiki/Trusted_Platform_Module) присутствует в большинстве микросхем Intel таким образом, чтобы: - решить, что хранить в постоянном ...
вопрос задан: 7 December 2011 18:12
0
ответов

регистры esp и ebp

Я сейчас изучаю ассемблер для процессоров Intel. Поскольку стек "растет вниз", почему мы должны добавлять для доступа к определенному элементу [ebp + 8] ;; Это даст доступ к первому параметру, который я знаю ...
вопрос задан: 2 December 2011 20:02
0
ответов

Компилятор Intel против GCC

Когда я компилирую приложение с помощью компилятора Intel, оно работает медленнее, чем когда я компилирую его с помощью GCC. Вывод компилятора Intel более чем в 2 раза медленнее. Приложение содержит несколько вложенных циклов. Are ...
вопрос задан: 30 November 2011 15:31
0
ответов

Подходит ли этот такт для Intel i3?

Я использовал онлайн для измерения производительности SSE. #ifndef __TIMER_H __ # define __TIMER_H__ #pragma warning (push) # pragma warning (disable: 4035) // отключить предупреждение об отсутствии возвращаемого значения __forceinline ...
вопрос задан: 28 November 2011 18:22
0
ответов

IA-32e 64-bit IDT Gate Descriptor

В 64-bit IDT Gate Descriptor от Intel есть Segment Selector. Однако, насколько я понял из 5 частей руководства Intel, линейный адрес обработчика прерываний загружается в RIP из ...
вопрос задан: 27 November 2011 17:17
0
ответов

Как считывать счетчики производительности на процессорах i5, i7

Современные процессоры имеют довольно множество счетчиков производительности - http://www.intel.com/content/www/us/en/architecture-and-technology/64-ia-32-architectures-software-developer-system-programming-manual-325384 .. ..
вопрос задан: 11 November 2011 08:00
0
ответов

Загрузка кода на GPU (Intel Sandy Bridge)

Мой вопрос не о GPGPU. Я достаточно хорошо понимаю GPGPU, и это не то, что я ищу. Предполагается, что у Intel Sand Bridge есть некоторые функции, которые позволяют напрямую выполнять ...
вопрос задан: 8 November 2011 20:46
0
ответов

Получаю ли я снижение производительности при смешивании инструкций SIMD и многопоточности

Мне было интересно сделать проект о распознавании лиц (чтобы использовать набор инструкций SIMD). Но в течение первого семестра текущего года я кое-что узнал о потоках, и я был ...
вопрос задан: 8 November 2011 04:03
0
ответов

Отображенная память и SSE

Я нашел этот абзац в руководстве разработчика Intel: Из главы «ПРОГРАММИРОВАНИЕ С SSE3, SSSE3, SSE4 И AESNI» Потоковая загрузка не должна использоваться для обращения к адресам памяти, которые ...
вопрос задан: 4 November 2011 23:58
0
ответов

Является ли переменная __m128i нулем?

Как проверить, имеет ли переменная __m128i ненулевое значение на процессорах SSE-2 и более ранних версий?
вопрос задан: 3 November 2011 03:18
0
ответов

Использование аппаратного генератора истинных случайных чисел Sandy Bridge?

Мне было интересно, есть ли способ использовать новый аппаратный генератор истинных чисел, который есть в процессоре Intel Sandy Bridge? Я читал, что Intel MKL (Math Kernel Library) раскрывает это ...
вопрос задан: 26 October 2011 11:39
0
ответов

Intel icc: как сбросить оптимизированный код в файл C

Опция Gcc -fdump-tree-optimized сбрасывает оптимизированную версию вашего кода C в файл C. Есть ли способ сделать то же самое с помощью компилятора intel icc? У меня есть код матричного умножения, который я ...
вопрос задан: 25 October 2011 22:49
0
ответов

Сборка Intel x86 - эквивалентны ли эти два утверждения?

Здесь очень простой вопрос ... Я пытаюсь обернуть Я схожу с ума по ассемблеру и мне интересно, эквивалентны ли эти операции: mov [ebx], 5 и lea esi, ebx mov esi, 5 Спасибо!
вопрос задан: 10 October 2011 21:31
0
ответов

MAC OSX Intel LLVM Assembler bug (causes Vorbis OGG loader to crash)

У меня возникла загадочная ошибка при загрузке файлов Vorbis Ogg на Mac OSX. Первый файл загружается правильно, второй падает в каком-то коде, который указывает, что файл поврежден, то же самое происходит, даже если я загружаю ...
вопрос задан: 10 October 2011 17:03
0
ответов

Как я могу написать приложение, использующее оборудование Intel IPT?

Что нужно для написания некоторого уровня абстракции для оборудования Intel IPT? Для тех, кто не знаком с Intel IPT, это встроенный сопроцессор, используемый для генерации уникальных 6-символьных одноразовых…
вопрос задан: 3 October 2011 17:59
0
ответов

Как использовать Pragmeth Intel Prefetch Pragma, когда данные, скрытые внутри объекта?

Intel, Relizully ​​предоставляет Pragetch Pragma; например #pragma Prefetch A для (i = 0; i
вопрос задан: 14 September 2011 12:49
0
ответов

С RIP-адресами, почему X86-64 по-прежнему нуждаются в перемещении?

Итак, X86-64 имеет RIP-относительные адреса, которые облегчают пишу коды, которые легко писать, и перемещение требуется гораздо меньше. Почему перемещения все еще нужны тогда на X86-64? Для каких особенностей? Я могу попытаться исследовать ...
вопрос задан: 6 September 2011 07:15
0
ответов

, Как параллелизм сделан в блоке Intel x86?

мне любопытно знать, как можно было бы кодировать параллельное программное обеспечение на блоке Intel x86. Оба потока или сопрограммы с получением интересны. Я понимаю, что это не практично, чтобы сделать в блоке, но я...
вопрос задан: 5 September 2011 12:53
0
ответов

Невозможно использовать SSSE3 на включенном процессоре

У меня есть процессор Xeon W3550, который должен поддерживать набор инструкций SSE4.2, но когда я попробуйте использовать что-нибудь за SSE2 в моей программе c, я получаю ошибку компилятора, например #error "SSE4.2 ...
вопрос задан: 24 August 2011 05:41
0
ответов

Предоставляют ли процессоры Core i3 / 5/7 механизм для измерения IPC?

Все процессоры Intel за последнее десятилетие (по крайней мере) включают набор мониторов производительности, которые подсчитывают различные события. Обеспечивают ли новейшие процессоры Intel, Core i3, i5 и i7 (также известные как Nehalem) механизм ...
вопрос задан: 5 July 2011 06:57
0
ответов

Изучение TBB Intel [закрыто]

Может ли кто-нибудь порекомендовать хорошую книгу о библиотеке потоков Intel и о том, как ее использовать?
вопрос задан: 30 June 2011 12:30