Это могло походить на субъективный вопрос, но что я ищу, определенные экземпляры, с которыми Вы, возможно, встретились связанный с этим. Как сделать код, кэш эффективный / кэш дружественный (больше...
У меня есть проблема.... Я пишу данные в массив в цикле с условием продолжения. И дело в том, что я делаю его действительно часто. Это, кажется, что эта запись является теперь узким местом в коде. Таким образом, как я...
Другая неделя, я записал немного класса потока и односторонний канал сообщения для разрешения коммуникации между потоками (два канала на поток, очевидно, для двунаправленной связи). Все работало...
существует ли путь в C++ для определения размера кэша ЦП? у меня есть алгоритм, который обрабатывает много данных, и я хотел бы разломать эти данные, на разделяет на блоки таким образом, что они вписываются в кэш. Это...
Я пытаюсь представить и оптимизировать алгоритмы, и я хотел бы понять определенное влияние кэшей на различных процессорах. Для недавних процессоров Intel x86 (например, Q9300), очень трудно...
При записи моделированиям мой приятель говорит, что ему нравится пытаться записать программу, достаточно маленькую для вписывания в кэш. Это имеет какое-либо реальное значение? Я понимаю, что кэш быстрее, чем RAM и основное...
У меня есть приложение, что потоки через 250 МБ данных, применяя простую и быструю пороговую функцию нейронной сети к блокам данных (которые являются всего 2 32-разрядными словами каждый). На основе результата (...
Как я могу программно иметь размеры (не, запрашивают ОС), размер и порядок ассоциативности L1 и кэшей L2 (кэши данных)? Предположения о системе: Это имеет L1, и кэш L2 (может быть L3 также, может быть...
Там какой-либо путь состоит в том, чтобы считать содержимое кэша ЦП? Архитектура для ARM. Я делаю недействительным диапазон адресов и затем хочу удостовериться, делается ли он недействительным или нет. Хотя я могу сделать чтение и...
У меня есть несколько вопросов относительно Кэш-памяти, используемой в Многоядерных центральных процессорах или Многопроцессорных системах. (Хотя не непосредственно связанный с программированием, это имеет много последствий, в то время как каждый пишет пр
Я интересуюсь принуждением очистки кэша ЦП в Windows (для сравнительного тестирования причин, я хочу эмулировать запуск без данных в кэше ЦП), предпочтительно основная реализация C или вызов Win32. Есть ли...
Clflush1 также сбрасывает связанные записи TLB? Я бы предположил, что нет, поскольку clflush работает с гранулярностью строки кэша, в то время как записи TLB существуют с (гораздо большей) гранулярностью страницы - но я ...
Я хочу перенести небольшой фрагмент кода на процессоре ARM Cortex A8. И кэш L1, и кеш L2 очень ограничены. В моей программе 3 массива. Последовательный доступ к двум из них (размер> Array A: 6MB ...
Я пытаюсь понять, как работает кэш ЦП. Допустим, у нас есть такая конфигурация (в качестве примера). Размер кеш-памяти 1024 байта
Строка кеширования 32 байта
1024/32 = 32 строки кэша вместе.
Сингел ...
Когда моя программа работает, операция загрузки с получают операцию семантики/хранилища с семантикой выпуска или возможно полным забором, это делает недействительным кэш ЦП. Мой вопрос - это: какая часть...
К чему скорость кэша получает доступ для современных центральных процессоров? Сколько байтов может быть считано или записано из памяти каждый такт системных часов процессора Intel P4, Core2, Corei7, AMD? Ответ с обоими теоретическими (...
Существует что-то, что прослушивает меня с моделью памяти Java (если я даже понимаю все правильно). Если существует два потока A и B, нет никаких гарантий, что B будет когда-либо видеть записанное значение...
Общепринято утверждать, что хранение байтов в кеше может привести к внутреннему циклу чтения-изменения-записи или иным образом снизить пропускную способность или задержку по сравнению с сохранением полного регистра. Но я никогда не видел ...
Я видел, что существуют многие из них. NCache, Скорость и т.д, но я не нашел таблицу, сравнивающую их. Что является лучшим рассмотрением следующего criterias: Легкий понять...
Я довольно новичок в измерении производительности. Я столкнулся с этим вопросом и решил проверить его сам. Вот как выглядят мои тесты: Для stack: section .text global _start _start: ...
Насколько я могу судить, аппаратные средства предварительной выборки будут как минимум обнаруживать и извлекать постоянные шаги в памяти. Кроме того, он может отслеживать шаблоны доступа к данным, что бы это ни значило на самом деле. Который ...
У меня проблемы с пониманием местоположения Справка. Может ли кто-нибудь помочь мне понять, что это означает и что такое Пространственная локальность ссылки
Временная локальность ссылки
Я помню, что предполагал, что попадание в кэш L1 составляет 1 цикл (, т. е. идентично времени доступа к регистру )в моем архитектурном классе, но так ли это на самом деле для современных процессоров x86? Сколько циклов выполняет L1...
Ниже приведены две программы, которые почти идентичны, за исключением того, что я поменял местами переменные i и j. Оба они работают в разное время. Может ли кто-нибудь объяснить, почему это происходит? Версия 1 #...
Я пытаюсь использовать Intel Performance Counter Monitor (PCM), чтобы понять отсутствие кэш-памяти L3 и некоторые другие критерии производительности в моем коде. Я не уверен, как разобраться в числах, которые я получаю и ...
Меня немного смущает значение "наложения" между кешем ЦП и физическим адресом.
Сначала я нашел его определение в Википедии: Однако VIVT страдает от проблем с псевдонимом, где несколько ...
У меня есть следующие процессы, я пытаюсь сделать ProcessB очень низкой задержкой, поэтому я все время использую тугой цикл и изолирую процессорное ядро 2. глобальная переменная в разделяемой памяти: int bDOIT; typedef struct XYZ_ {...
Кто-нибудь может дать мне приблизительное время (в наносекундах) для доступа к кешам L1, L2 и L3, а также основная память на процессорах Intel i7? Хотя это не совсем вопрос программирования, зная ...