0
ответов

Оболочка CUDA для Qt

Qt выпустила отличную оболочку для Opencl (QtOpencl), которая очень хорошо скрывает множество шаблонов и заставляет OpenCL хорошо взаимодействовать с виджетом Qt display и Opengl. Но есть ...
вопрос задан: 9 December 2011 05:17
0
ответов

Как рассчитать нагрузку на карту nvidia (с поддержкой cuda) и графическим процессором?

Я хочу знать, как отображать процент возможностей видеокарты при отправке задач на карту. Как системный монитор Gnome. Более того, как получить параметры устройства для расчета ...
вопрос задан: 7 December 2011 17:31
0
ответов

Какой прирост производительности дает GPU в matlab?

Я подумываю о том, чтобы попросить у своего начальника хороший GPU, чтобы выполнять вычисления с помощью пакета инструментов параллельной обработки matlab. Однако после нескольких простых тестов на компьютере коллеги, на NVidia Quadro ...
вопрос задан: 7 December 2011 16:37
0
ответов

Параллельная запись в одну и ту же область глобальной памяти

У меня есть несколько блоков, каждый из которых имеет несколько целых чисел в массиве общей памяти размер 512. Как я могу проверить, содержит ли массив в каждом блоке ноль в качестве элемента? Я создаю ...
вопрос задан: 7 December 2011 14:20
0
ответов

CUDA Stream compaction: понимание концепции

Я использую CUDA / Thrust / CUDPP. Насколько я понимаю, при сжатии Stream определенные элементы в массиве помечаются как недопустимые, а затем «удаляются». Что на самом деле означает здесь «удаление»? Предположим, что ...
вопрос задан: 5 December 2011 16:01
0
ответов

При использовании более одного графического процессора в matlab

это результат работы ginfo с использованием Jacket / matlab: Обнаружены графические процессоры с поддержкой CUDA: Драйвер CUDA 270.81, набор инструментов CUDA 4.0 GPU0 Tesla C1060, 4096 МБ, Compute 1.3 (одинарный, двойной) (используется) GPU1 Tesla C1
вопрос задан: 5 December 2011 04:16
0
ответов

Параметры ядер CUDA

При вызове ядра CUDA для конкретной конфигурации потока существуют ли какие-либо строгие правила, касающиеся того, в каком пространстве памяти (устройство / хост) должны находиться параметры ядра и какого типа они должны быть? ...
вопрос задан: 3 December 2011 03:11
0
ответов

Единицы регистров cuda

Кто-нибудь может сказать мне, что такое единицы регистров NVIDIA cuda? Когда у меня 8192 регистра на блок, это означает, что в байтах или битах?
вопрос задан: 25 November 2011 12:51
0
ответов

Синхронизация CUDA и чтение глобальной памяти

У меня есть что-то вроде этого: __global__ void globFunction (int * arr, int N) {int idx = blockIdx.x * blockDim.x + threadIdx.x; // вычисление и запись результатов в arr ... __syncthreads (); ...
вопрос задан: 24 November 2011 11:20
0
ответов

Пожалуйста, объясните пример кода cudaMemcpyToSymbol из Руководства по программированию CUDA

Есть ли проблема в этом примере кода из Руководства по программированию CUDA C? __device__ float devData; float value = 3.14f; cudaMemcpyToSymbol (devData, & value, sizeof (float)); Я не могу понять ...
вопрос задан: 21 November 2011 07:14
0
ответов

Сокращение суммы с помощью CUDA: что такое N?

Согласно NVIDIA, это самое быстрое ядро ​​сокращения суммы: template __ device__ void warpReduce (volatile int * sdata, unsigned int tid ) { if (blockSize> = 64) ...
вопрос задан: 18 November 2011 00:58
0
ответов

Cuda Bayer / Пример демозаики CFA

Я написал подпрограмму демозаики CUDA4 Bayer, но она медленнее, чем код однопоточного ЦП, работающий на 16-ядерном GTS250. Размер блока равен (16,16), а яркость изображения кратна из 16 - но меняется ...
вопрос задан: 16 November 2011 17:38
0
ответов

CUDA: указатели памяти хоста не копируются в память устройства

у нас есть следующая определенная структура typedef struct PurchaseOrder {char * Value1; double Value2; double * Value3; int Value3Length; __device__ int GetValue3Length () {return ...
вопрос задан: 15 November 2011 20:09
0
ответов

Ошибка компиляции CUDA из командной строки

Я пытаюсь скомпилировать тестовую программу cuda в Windows 7 через командную строку, я это команда: nvcc test.cu Но все, что я получаю, это ошибка: nvcc fatal: не удается найти компилятор cl.exe в PATH Что может ...
вопрос задан: 14 November 2011 17:49
0
ответов

Какие преимущества MPI + CUDA перед чистым MPI?

Обычный способ ускорить приложение - распараллелить приложение с помощью MPI или библиотек более высокого уровня, таких как PETSc, которые используют MPI под капотом. Однако в настоящее время кажется, что все заинтересованы ...
вопрос задан: 9 November 2011 07:05
0
ответов

Размеры блоков в CUDA

У меня есть вычислительная способность NVIDIA GTX 570 2.0 под управлением cuda-4.0. Исполняемый файл deviceQuery в CUDA SDK предоставляет мне информацию о моем устройстве CUDA и его различных свойствах. Две строчки в…
вопрос задан: 4 November 2011 13:13
0
ответов

Использование cudamalloc(). Почему двойной указатель?

В настоящее время я просматриваю примеры учебников по http://code.google.com/p/stanford-cs193g-sp2010/, чтобы изучить CUDA. Код, который демостралирует __global__ функции, приведен ниже. Он просто создает...
вопрос задан: 3 November 2011 00:37
0
ответов

Пример проекта CUDA C # .Net? VS2010

Я хотел бы знать, есть ли у кого-нибудь пример проекта CUDA C # .Net, который работает с VS 2010. Я использую все 64-разрядные версии и CUDA 4.0. Я пробовал следующее: GPU .Net - сбой, их приложение не будет ...
вопрос задан: 3 November 2011 00:22
0
ответов

Различия в производительности pyCUDA и C.

Я новичок в программировании на CUDA, и мне было интересно, как производительность pyCUDA сравнивается с программами, реализованными на простом языке C. Будет ли производительность примерно такой же? Есть ли какие-нибудь узкие места, которые ...
вопрос задан: 28 October 2011 16:32
0
ответов

Как устроена двумерная общая память в CUDA

Я всегда работал с линейной разделяемой памятью (загрузка, хранение, доступ к соседям), но я сделал простой тест в двухмерном режиме для изучения конфликтов банков, результаты которого меня сбили с толку . Следующий код считывает данные из ...
вопрос задан: 26 October 2011 14:15
0
ответов

Стратегии программирования с несколькими GPU с использованием CUDA

Мне нужен совет по поводу проекта, которым я собираюсь заняться. Я планирую запустить простые ядра (еще предстоит решить, но я полагаюсь на досадно параллельные) на узле Multi-GPU с использованием CUDA 4.0…
вопрос задан: 23 October 2011 17:20
0
ответов

Обобщенные вычисления в скользящем окне на GPU

Вот код Python, который реализует вычисление в скользящем окне для двух 3D-матриц, X и Y. import numpy def slide_dot (X , Y): assert X.ndim == Y.ndim == 3 iw, ih, id = X.shape ...
вопрос задан: 10 October 2011 02:43
0
ответов

Межблочный барьер на CUDA

Я хочу реализовать межблочный барьер на CUDA, но сталкиваюсь с серьезные проблемы. Я не могу понять, почему это не работает. #include # include # include <...
вопрос задан: 9 October 2011 12:18
0
ответов

Сколько памяти я могу выделить на карте cuda

Я пишу серверный процесс, который выполняет вычисления на графическом процессоре с использованием cuda. ​​Я хочу поставить в очередь входящие запросов до тех пор, пока на устройстве не станет достаточно памяти для выполнения задания, но у меня возникают
вопрос задан: 7 October 2011 13:00
0
ответов

Комплексное преобразование тяги трех векторов разного размера

Здравствуйте, у меня есть этот цикл в C +, и я пытался преобразовать его в тягу, но без тех же результатов ... Есть идеи? {{ 1}} спасибо Код C ++ для (i = 0; i
вопрос задан: 2 October 2011 13:07
0
ответов

Возможности библиотечных функций в Mathematica

Я пытаюсь использовать CUSP как внешний линейный решатель для Mathematica, чтобы использовать возможности GPU. Вот веб-страница проекта CUSP. Я прошу подсказать, как мы можем интегрировать CUSP с ...
вопрос задан: 28 September 2011 12:41
0
ответов

Какой самый дешевый способ построить ферму серверов Erlang (для хобби-проекта)? [closed]

Допустим, у нас есть «внутренне параллельная» проблема, которую нужно решить с помощью нашего программного обеспечения на Erlang. У нас много параллельных процессов, и каждый из них выполняет последовательный код (не вычисление чисел) и ...
вопрос задан: 27 September 2011 11:49
0
ответов

создание контекста cuda и ассоциация ресурсов в приложениях API среды выполнения

Я хочу понять, как контекст cuda создается и связывается с ядром в приложениях API времени выполнения cuda? Я знаю, что это делается под капотом API драйверов. Но я хотел бы понять ...
вопрос задан: 23 September 2011 21:40
0
ответов

Насколько хорошо NVCC оптимизирует код?

Насколько хорошо NVCC оптимизирует код устройства? Делает ли он какие-либо оптимизации вроде сворачивания констант и устранения общих подвыражений? Например, сократит ли он следующее: float a = 1 / sqrtf(2 * ...
вопрос задан: 23 September 2011 14:39
0
ответов

OpenCV CUDA работает медленнее, чем OpenCV CPU

Я пытаюсь заставить OpenCV CUDA улучшить производительность для таких вещей, как erode/dilate, frame differencing etc, когда я читаю видео из avi файла. типично я получаю половину FPS на GPU (. ...
вопрос задан: 23 September 2011 09:18