11
ответов

Как каждый пишет код, который лучше всего использует кэш ЦП для улучшения производительности?

Это могло походить на субъективный вопрос, но что я ищу, определенные экземпляры, с которыми Вы, возможно, встретились связанный с этим. Как сделать код, кэш эффективный / кэш дружественный (больше...
вопрос задан: 1 August 2015 13:04
11
ответов

Действительно ли возможно заблокировать некоторые данные в кэше ЦП?

У меня есть проблема.... Я пишу данные в массив в цикле с условием продолжения. И дело в том, что я делаю его действительно часто. Это, кажется, что эта запись является теперь узким местом в коде. Таким образом, как я...
вопрос задан: 5 March 2012 12:41
9
ответов

Я могу вызвать когерентность кэш-памяти на многоядерном x86 ЦП?

Другая неделя, я записал немного класса потока и односторонний канал сообщения для разрешения коммуникации между потоками (два канала на поток, очевидно, для двунаправленной связи). Все работало...
вопрос задан: 17 March 2015 13:36
7
ответов

Кэш C++ осведомленное программирование

существует ли путь в C++ для определения размера кэша ЦП? у меня есть алгоритм, который обрабатывает много данных, и я хотел бы разломать эти данные, на разделяет на блоки таким образом, что они вписываются в кэш. Это...
вопрос задан: 30 July 2010 09:25
6
ответов

Где кэш памяти L1 процессоров Intel x86 зарегистрирован?

Я пытаюсь представить и оптимизировать алгоритмы, и я хотел бы понять определенное влияние кэшей на различных процессорах. Для недавних процессоров Intel x86 (например, Q9300), очень трудно...
вопрос задан: 3 November 2015 06:55
5
ответов

Код дизайна для помещений в Кэш ЦП?

При записи моделированиям мой приятель говорит, что ему нравится пытаться записать программу, достаточно маленькую для вписывания в кэш. Это имеет какое-либо реальное значение? Я понимаю, что кэш быстрее, чем RAM и основное...
вопрос задан: 3 August 2015 21:09
4
ответа

Эффективная пропускная способность памяти использует для потоковой передачи

У меня есть приложение, что потоки через 250 МБ данных, применяя простую и быструю пороговую функцию нейронной сети к блокам данных (которые являются всего 2 32-разрядными словами каждый). На основе результата (...
вопрос задан: 24 August 2016 14:28
4
ответа

Размер меры и дорожный порядок L1 и кэшей L2

Как я могу программно иметь размеры (не, запрашивают ОС), размер и порядок ассоциативности L1 и кэшей L2 (кэши данных)? Предположения о системе: Это имеет L1, и кэш L2 (может быть L3 также, может быть...
вопрос задан: 24 August 2016 14:12
4
ответа

считайте содержимое кэша ЦП

Там какой-либо путь состоит в том, чтобы считать содержимое кэша ЦП? Архитектура для ARM. Я делаю недействительным диапазон адресов и затем хочу удостовериться, делается ли он недействительным или нет. Хотя я могу сделать чтение и...
вопрос задан: 30 July 2010 09:18
3
ответа

Как кэш-память совместно используется в многоядерном Intel CPUs?

У меня есть несколько вопросов относительно Кэш-памяти, используемой в Многоядерных центральных процессорах или Многопроцессорных системах. (Хотя не непосредственно связанный с программированием, это имеет много последствий, в то время как каждый пишет пр
вопрос задан: 20 September 2017 13:41
3
ответа

Как я могу сделать очистку кэша ЦП в x86 Windows?

Я интересуюсь принуждением очистки кэша ЦП в Windows (для сравнительного тестирования причин, я хочу эмулировать запуск без данных в кэше ЦП), предпочтительно основная реализация C или вызов Win32. Есть ли...
вопрос задан: 8 November 2015 10:31
2
ответа

Clflush также удаляет записи TLB?

Clflush1 также сбрасывает связанные записи TLB? Я бы предположил, что нет, поскольку clflush работает с гранулярностью строки кэша, в то время как записи TLB существуют с (гораздо большей) гранулярностью страницы - но я ...
вопрос задан: 16 January 2019 10:45
2
ответа

Оптимизация использования кэша ARM для разных массивов

Я хочу перенести небольшой фрагмент кода на процессоре ARM Cortex A8. И кэш L1, и кеш L2 очень ограничены. В моей программе 3 массива. Последовательный доступ к двум из них (размер> Array A: 6MB ...
вопрос задан: 5 January 2015 20:23
2
ответа

Общие сведения о кэше ЦП и строке кэша

Я пытаюсь понять, как работает кэш ЦП. Допустим, у нас есть такая конфигурация (в качестве примера). Размер кеш-памяти 1024 байта Строка кеширования 32 байта 1024/32 = 32 строки кэша вместе. Сингел ...
вопрос задан: 15 February 2011 17:57
2
ответа

Are CPU registers and CPU cache different? [closed]

Are CPU registers and CPU cache different?
вопрос задан: 17 August 2010 08:08
2
ответа

Лишение законной силы кэша ЦП

Когда моя программа работает, операция загрузки с получают операцию семантики/хранилища с семантикой выпуска или возможно полным забором, это делает недействительным кэш ЦП. Мой вопрос - это: какая часть...
вопрос задан: 30 July 2010 09:23
2
ответа

Пропускная способность кэша на галочку для современных центральных процессоров

К чему скорость кэша получает доступ для современных центральных процессоров? Сколько байтов может быть считано или записано из памяти каждый такт системных часов процессора Intel P4, Core2, Corei7, AMD? Ответ с обоими теоретическими (...
вопрос задан: 30 July 2010 09:22
2
ответа

Модель памяти Java (JSR-133) подразумевают, что ввод монитора сбрасывает кэш (кэши) данных ЦП?

Существует что-то, что прослушивает меня с моделью памяти Java (если я даже понимаю все правильно). Если существует два потока A и B, нет никаких гарантий, что B будет когда-либо видеть записанное значение...
вопрос задан: 30 July 2010 09:18
1
ответ

Существуют ли какие-либо современные / древние процессоры / микроконтроллеры, в которых хранилище кэшированных байтов на самом деле медленнее хранилища слов?

Общепринято утверждать, что хранение байтов в кеше может привести к внутреннему циклу чтения-изменения-записи или иным образом снизить пропускную способность или задержку по сравнению с сохранением полного регистра. Но я никогда не видел ...
вопрос задан: 16 January 2019 20:33
1
ответ

Почему размер кэша L1 меньше, чем размер кеша L2 в большинстве процессоров?

Почему размер кеша L1 меньше чем размер кэша L2 в большинстве процессоров?
вопрос задан: 12 June 2018 03:11
1
ответ

Каков лучший кэш NHibernate поставщик L2?

Я видел, что существуют многие из них. NCache, Скорость и т.д, но я не нашел таблицу, сравнивающую их. Что является лучшим рассмотрением следующего criterias: Легкий понять...
вопрос задан: 24 August 2016 14:29
1
ответ

Как аннулировать строки кеша? [Дубликат]

Я довольно новичок в измерении производительности. Я столкнулся с этим вопросом и решил проверить его сам. Вот как выглядят мои тесты: Для stack: section .text global _start _start: ...
вопрос задан: 12 April 2016 03:46
1
ответ

Может & ldquo; non-native & rdquo; указатели повреждают производительность кэша?

Насколько я могу судить, аппаратные средства предварительной выборки будут как минимум обнаруживать и извлекать постоянные шаги в памяти. Кроме того, он может отслеживать шаблоны доступа к данным, что бы это ни значило на самом деле. Который ...
вопрос задан: 13 November 2013 13:27
0
ответов

Какое местоположение ссылки?

У меня проблемы с пониманием местоположения Справка. Может ли кто-нибудь помочь мне понять, что это означает и что такое Пространственная локальность ссылки Временная локальность ссылки
вопрос задан: 30 June 2019 14:44
0
ответов

Циклы/стоимость попадания в L1 Cache vs. Зарегистрироваться на x86?

Я помню, что предполагал, что попадание в кэш L1 составляет 1 цикл (, т. е. идентично времени доступа к регистру )в моем архитектурном классе, но так ли это на самом деле для современных процессоров x86? Сколько циклов выполняет L1...
вопрос задан: 30 April 2019 19:48
0
ответов

Почему порядок циклов влияет на производительность при переборе 2D-массива?

Ниже приведены две программы, которые почти идентичны, за исключением того, что я поменял местами переменные i и j. Оба они работают в разное время. Может ли кто-нибудь объяснить, почему это происходит? Версия 1 #...
вопрос задан: 7 March 2019 22:36
0
ответов

Как сузить данные Intel PCM до единого процесса?

Я пытаюсь использовать Intel Performance Counter Monitor (PCM), чтобы понять отсутствие кэш-памяти L3 и некоторые другие критерии производительности в моем коде. Я не уверен, как разобраться в числах, которые я получаю и ...
вопрос задан: 2 March 2019 20:48
0
ответов

Определение / значение псевдонима? (Архитектура кеш-памяти ЦП)

Меня немного смущает значение "наложения" между кешем ЦП и физическим адресом. Сначала я нашел его определение в Википедии: Однако VIVT страдает от проблем с псевдонимом, где несколько ...
вопрос задан: 17 January 2019 04:31
0
ответов

x86 MESI делает недействительной проблему задержки строки кэша

У меня есть следующие процессы, я пытаюсь сделать ProcessB очень низкой задержкой, поэтому я все время использую тугой цикл и изолирую процессорное ядро ​​2. глобальная переменная в разделяемой памяти: int bDOIT; typedef struct XYZ_ {...
вопрос задан: 16 January 2019 03:11
0
ответов

Приблизительная стоимость доступа к различным кэшам и основной памяти?

Кто-нибудь может дать мне приблизительное время (в наносекундах) для доступа к кешам L1, L2 и L3, а также основная память на процессорах Intel i7? Хотя это не совсем вопрос программирования, зная ...
вопрос задан: 15 December 2018 07:28