Я тестирую программное обеспечение, которое работает в 4 раза быстрее на Intel 2670QM, чем моя последовательная версия, используя все 8 моих «логических» потоков. Я хотел бы получить отзывы сообщества о моем восприятии бенчмаркинга...
I want to parallelize a C serial code in a 100 node distributed memory cluster. The cluster consists of 25 blades with 4 cores each by infiniband. Before I just used PBS to spread several serial runs ...
У меня есть код C которые вычисляют расстояние между двумя наборами узлов (по три координаты каждый), хотя мой код еще был достаточно быстрым, я хочу немного увеличить его с помощью параллельных вычислений. Я '...
$ gcc 12.c -fopenmp 12.c: 9: 9: фатальная ошибка: файл 'omp.h' не найден #include ^ 1 сгенерирована ошибка. При компиляции программ openMP я получаю вышеуказанную ошибку. Я использую OS X Yosemite. Я ...
Я написал программу на C для вычисления числа Pi с использованием OpenMP, получив помощь из книги. Я считаю, что производительность этой программы будет зависеть от используемых процессоров. В моем случае я использовал переменную окружения ...
Я распараллеливаю конструкцию parallel for в OpenMP. В спецификациях OpenMP я вижу:void sub(float *a){ инт я, дж, к; #прагма omp для коллапса(2)приват(i, k, j)для (k=kl; к<=ку; k+=ks)...
Я пытаюсь реализовать OpenMP-версию двумерного моделирования n-тела. Но есть проблема: я предполагаю, что начальная скорость и ускорение каждой частицы равны нулю. Когда частицы ...
Я изучаю основы параллельного выполнения цикла for с использованием OpenMP. К сожалению, моя паралельная программа работает в 10 раз медленнее, чем серийная версия. Что я делаю неправильно? Я пропускаю некоторые барьеры? двойной ** ...
Моя версия openMP не увеличивала скорость. У меня двухъядерный компьютер, и загрузка процессора всегда составляет 50%. Итак, я попробовал образец программы, приведенный в Wiki. Похоже, компилятор openMP (Visual Studio ...
Я разрабатываю большой код умножения плотной матрицы. Когда я профилирую код, он иногда получает около 75% пиковых провалов в моей четырехъядерной системе, а иногда - около 36%. Эффективность ...
Я пытаюсь распараллелить свою программу с помощью openMP. Программа активно использует STL-итераторы. Говорят, что openMP 3.0 может справиться с этим: std :: vector N (2 * N_max + 1); std :: vector
Документация к инструменту обнаружения ошибок потока Valgrind Helgrind, найденная здесь, предупреждает, что если вы используете GCC для компиляции вашего кода OpenMP, библиотека времени выполнения GCC OpenMP (libgomp.so) вызовет ...
Я ищу способ выполнить разделы кода параллельно, используя несколько потоков для каждого раздела. Например, если у меня есть 16 потоков и две задачи, я хочу использовать 8 потоков, каждый из которых можно одновременно выполнить ...
У меня есть машина с двумя сокетами Xeon E5522 2,26 ГГц (с отключенной гиперпоточностью ), на которой работает сервер Ubuntu на ядре Linux 3.0 с поддержкой NUMA. Схема архитектуры — 4 физических ядра на сокет. Ан...
OpenMP запрещает код, который покидает блок openmp через исключение. Поэтому я ищу хороший способ получить исключения из блока openmp с целью его повторного создания в основном...
По умолчанию директива OpenMP :opm _get _num _threads дает количество потоков, эквивалентное процессорам/ядрам. У меня 8-ядерная машина, поэтому она дает мне 8 потоков. Это максимум? Можно еще...
У меня есть блоки памяти, которые могут быть довольно большими (больше, чем кэш L2 ), и иногда я должен установить их все равными нулю. memset хорош в последовательном коде, но как насчет параллельного кода? Кто-нибудь...
У меня есть довольно сложная программа, которая ведет себя странно при сборке с OpenMP в режиме отладки MSVC 2010. Я изо всех сил старался построить следующий минимальный рабочий пример (, хотя он...
У меня есть опыт программирования OpenMP для машин с общей памятью (как на C, так и на FORTRAN )для выполнения простых задач, таких как сложение матриц, умножение и т. д. (Просто чтобы посмотреть, как он конкурирует с LAPACK ). Я...
Допустим, есть компьютер с 4 процессорами, каждый из которых имеет 2 ядра, всего 8 ядер. С моим ограниченным пониманием я думаю, что в этом случае все процессоры используют одну и ту же память. Теперь, не лучше ли...
Я пишу параллельную программу, используя OpenMP на C++. Я хочу контролировать количество потоков в программе с помощью omp_set_num_threads(), но это не работает. #include <иопоток>
#include <...
Во-первых, я знаю, что этот [тип] вопрос часто задают, поэтому позвольте мне предварить это, сказав, что я читал как столько, сколько я могу, и я до сих пор не знаю, в чем дело. Я распараллелил массивный внешний ...
Я пишу программу, которая читает огромный файл (3x280 ГБ) и выполняет процедуру подгонки к данным в файле. Распараллеливать такую программу довольно удобно, там, где это легко делается с помощью OpenMP.
...
Если я использую общую переменную, скажем, двойную, для вычисления какой-то суммы во время выполнения программы. Будет ли это в любом случае уязвимо для нестабильных операций? Я имею в виду, будет ли это...
В настоящее время я использую openMP для написания кода, работающего на многоядерных узлах. openMP имеет особую модель памяти, которая гарантирует синхронизацию памяти между потоками, работающими на разных ядрах, когда ...
Я выполняю код .cpp (i) в последовательном стиле и (ii) с использованием операторов OpenMP. Я пытаюсь увидеть разницу во времени. Для расчета времени я использую это: #include
.....
основной()
{ ...