cuda - список вопросов по программированию cuda

0

ответов

Оболочка CUDA для Qt

Qt выпустила отличную оболочку для Opencl (QtOpencl), которая очень хорошо скрывает множество шаблонов и заставляет OpenCL хорошо взаимодействовать с виджетом Qt display и Opengl. Но есть ...

c++ qt cuda opencl

вопрос задан: 9 December 2011 05:17

0

ответов

Как рассчитать нагрузку на карту nvidia (с поддержкой cuda) и графическим процессором?

Я хочу знать, как отображать процент возможностей видеокарты при отправке задач на карту. Как системный монитор Gnome. Более того, как получить параметры устройства для расчета ...

c++ cuda hardware gpu nvidia

вопрос задан: 7 December 2011 17:31

0

ответов

Какой прирост производительности дает GPU в matlab?

Я подумываю о том, чтобы попросить у своего начальника хороший GPU, чтобы выполнять вычисления с помощью пакета инструментов параллельной обработки matlab. Однако после нескольких простых тестов на компьютере коллеги, на NVidia Quadro ...

matlab cuda gpu

вопрос задан: 7 December 2011 16:37

0

ответов

Параллельная запись в одну и ту же область глобальной памяти

У меня есть несколько блоков, каждый из которых имеет несколько целых чисел в массиве общей памяти размер 512. Как я могу проверить, содержит ли массив в каждом блоке ноль в качестве элемента? Я создаю ...

c++ c cuda

вопрос задан: 7 December 2011 14:20

0

ответов

CUDA Stream compaction: понимание концепции

Я использую CUDA / Thrust / CUDPP. Насколько я понимаю, при сжатии Stream определенные элементы в массиве помечаются как недопустимые, а затем «удаляются». Что на самом деле означает здесь «удаление»? Предположим, что ...

algorithm cuda gpu thrust cudpp

вопрос задан: 5 December 2011 16:01

0

ответов

При использовании более одного графического процессора в matlab

это результат работы ginfo с использованием Jacket / matlab: Обнаружены графические процессоры с поддержкой CUDA: Драйвер CUDA 270.81, набор инструментов CUDA 4.0 GPU0 Tesla C1060, 4096 МБ, Compute 1.3 (одинарный, двойной) (используется) GPU1 Tesla C1

matlab image-processing cuda parallel-processing gpu

вопрос задан: 5 December 2011 04:16

0

ответов

Параметры ядер CUDA

При вызове ядра CUDA для конкретной конфигурации потока существуют ли какие-либо строгие правила, касающиеся того, в каком пространстве памяти (устройство / хост) должны находиться параметры ядра и какого типа они должны быть? ...

cuda gpgpu

вопрос задан: 3 December 2011 03:11

0

ответов

Единицы регистров cuda

Кто-нибудь может сказать мне, что такое единицы регистров NVIDIA cuda? Когда у меня 8192 регистра на блок, это означает, что в байтах или битах?

cuda size units-of-measurement

вопрос задан: 25 November 2011 12:51

0

ответов

Синхронизация CUDA и чтение глобальной памяти

У меня есть что-то вроде этого: __global__ void globFunction (int * arr, int N) {int idx = blockIdx.x * blockDim.x + threadIdx.x; // вычисление и запись результатов в arr ... __syncthreads (); ...

cuda

вопрос задан: 24 November 2011 11:20

0

ответов

Пожалуйста, объясните пример кода cudaMemcpyToSymbol из Руководства по программированию CUDA

Есть ли проблема в этом примере кода из Руководства по программированию CUDA C? __device__ float devData; float value = 3.14f; cudaMemcpyToSymbol (devData, & value, sizeof (float)); Я не могу понять ...

cuda

вопрос задан: 21 November 2011 07:14

0

ответов

Сокращение суммы с помощью CUDA: что такое N?

Согласно NVIDIA, это самое быстрое ядро сокращения суммы: template __ device__ void warpReduce (volatile int * sdata, unsigned int tid ) { if (blockSize> = 64) ...

cuda parallel-processing sum

вопрос задан: 18 November 2011 00:58

0

ответов

Cuda Bayer / Пример демозаики CFA

Я написал подпрограмму демозаики CUDA4 Bayer, но она медленнее, чем код однопоточного ЦП, работающий на 16-ядерном GTS250. Размер блока равен (16,16), а яркость изображения кратна из 16 - но меняется ...

performance image cuda

вопрос задан: 16 November 2011 17:38

0

ответов

CUDA: указатели памяти хоста не копируются в память устройства

у нас есть следующая определенная структура typedef struct PurchaseOrder {char * Value1; double Value2; double * Value3; int Value3Length; __device__ int GetValue3Length () {return ...

cuda

вопрос задан: 15 November 2011 20:09

0

ответов

Ошибка компиляции CUDA из командной строки

Я пытаюсь скомпилировать тестовую программу cuda в Windows 7 через командную строку, я это команда: nvcc test.cu Но все, что я получаю, это ошибка: nvcc fatal: не удается найти компилятор cl.exe в PATH Что может ...

cuda nvidia

вопрос задан: 14 November 2011 17:49

0

ответов

Какие преимущества MPI + CUDA перед чистым MPI?

Обычный способ ускорить приложение - распараллелить приложение с помощью MPI или библиотек более высокого уровня, таких как PETSc, которые используют MPI под капотом. Однако в настоящее время кажется, что все заинтересованы ...

algorithm cuda mpi

вопрос задан: 9 November 2011 07:05

0

ответов

Размеры блоков в CUDA

У меня есть вычислительная способность NVIDIA GTX 570 2.0 под управлением cuda-4.0. Исполняемый файл deviceQuery в CUDA SDK предоставляет мне информацию о моем устройстве CUDA и его различных свойствах. Две строчки в…

sdk cuda

вопрос задан: 4 November 2011 13:13

0

ответов

Использование cudamalloc(). Почему двойной указатель?

В настоящее время я просматриваю примеры учебников по http://code.google.com/p/stanford-cs193g-sp2010/, чтобы изучить CUDA. Код, который демостралирует __global__ функции, приведен ниже. Он просто создает...

c cuda malloc

вопрос задан: 3 November 2011 00:37

0

ответов

Пример проекта CUDA C # .Net? VS2010

Я хотел бы знать, есть ли у кого-нибудь пример проекта CUDA C # .Net, который работает с VS 2010. Я использую все 64-разрядные версии и CUDA 4.0. Я пробовал следующее: GPU .Net - сбой, их приложение не будет ...

c# .net cuda

вопрос задан: 3 November 2011 00:22

0

ответов

Различия в производительности pyCUDA и C.

Я новичок в программировании на CUDA, и мне было интересно, как производительность pyCUDA сравнивается с программами, реализованными на простом языке C. Будет ли производительность примерно такой же? Есть ли какие-нибудь узкие места, которые ...

c cuda pycuda

вопрос задан: 28 October 2011 16:32

0

ответов

Как устроена двумерная общая память в CUDA

Я всегда работал с линейной разделяемой памятью (загрузка, хранение, доступ к соседям), но я сделал простой тест в двухмерном режиме для изучения конфликтов банков, результаты которого меня сбили с толку . Следующий код считывает данные из ...

cuda

вопрос задан: 26 October 2011 14:15

0

ответов

Стратегии программирования с несколькими GPU с использованием CUDA

Мне нужен совет по поводу проекта, которым я собираюсь заняться. Я планирую запустить простые ядра (еще предстоит решить, но я полагаюсь на досадно параллельные) на узле Multi-GPU с использованием CUDA 4.0…

cuda

вопрос задан: 23 October 2011 17:20

0

ответов

Обобщенные вычисления в скользящем окне на GPU

Вот код Python, который реализует вычисление в скользящем окне для двух 3D-матриц, X и Y. import numpy def slide_dot (X , Y): assert X.ndim == Y.ndim == 3 iw, ih, id = X.shape ...

cuda gpu dot-product sliding-window

вопрос задан: 10 October 2011 02:43

0

ответов

Межблочный барьер на CUDA

Я хочу реализовать межблочный барьер на CUDA, но сталкиваюсь с серьезные проблемы. Я не могу понять, почему это не работает. #include # include # include <...

c cuda gpgpu nvidia

вопрос задан: 9 October 2011 12:18

0

ответов

Сколько памяти я могу выделить на карте cuda

Я пишу серверный процесс, который выполняет вычисления на графическом процессоре с использованием cuda. Я хочу поставить в очередь входящие запросов до тех пор, пока на устройстве не станет достаточно памяти для выполнения задания, но у меня возникают

cuda

вопрос задан: 7 October 2011 13:00

0

ответов

Комплексное преобразование тяги трех векторов разного размера

Здравствуйте, у меня есть этот цикл в C +, и я пытался преобразовать его в тягу, но без тех же результатов ... Есть идеи? {{ 1}} спасибо Код C ++ для (i = 0; i

cuda thrust

вопрос задан: 2 October 2011 13:07

0

ответов

Возможности библиотечных функций в Mathematica

Я пытаюсь использовать CUSP как внешний линейный решатель для Mathematica, чтобы использовать возможности GPU. Вот веб-страница проекта CUSP. Я прошу подсказать, как мы можем интегрировать CUSP с ...

wolfram-mathematica cuda gpu linear-algebra numerics

вопрос задан: 28 September 2011 12:41

0

ответов

Какой самый дешевый способ построить ферму серверов Erlang (для хобби-проекта)? [closed]

Допустим, у нас есть «внутренне параллельная» проблема, которую нужно решить с помощью нашего программного обеспечения на Erlang. У нас много параллельных процессов, и каждый из них выполняет последовательный код (не вычисление чисел) и ...

erlang cuda parallel-processing

вопрос задан: 27 September 2011 11:49

0

ответов

создание контекста cuda и ассоциация ресурсов в приложениях API среды выполнения

Я хочу понять, как контекст cuda создается и связывается с ядром в приложениях API времени выполнения cuda? Я знаю, что это делается под капотом API драйверов. Но я хотел бы понять ...

cuda

вопрос задан: 23 September 2011 21:40

0

ответов

Насколько хорошо NVCC оптимизирует код?

Насколько хорошо NVCC оптимизирует код устройства? Делает ли он какие-либо оптимизации вроде сворачивания констант и устранения общих подвыражений? Например, сократит ли он следующее: float a = 1 / sqrtf(2 * ...

cuda gpgpu

вопрос задан: 23 September 2011 14:39

0

ответов

OpenCV CUDA работает медленнее, чем OpenCV CPU

Я пытаюсь заставить OpenCV CUDA улучшить производительность для таких вещей, как erode/dilate, frame differencing etc, когда я читаю видео из avi файла. типично я получаю половину FPS на GPU (. ...

c++ opencv cuda parallel-processing

вопрос задан: 23 September 2011 09:18