cuda - список вопросов по программированию cuda

0

ответов

CUDA, как получить сетку, блок, размер потока и параллельное вычисление неквадратной матрицы

Я новичок в CUDA и мне нужна помощь в понимании некоторых вещей. Мне нужна помощь в распараллеливании этих двух циклов for. В частности, как настроить dimBlock и dimGrid, чтобы это работало быстрее. Я знаю это ...

вопрос задан: 11 March 2012 20:24

0

ответов

при установке модуля cuda не удается найти библиотеку драйверов cuda

Я пытаюсь установить модуль ускорения Мануэля Чакраварти, но у меня возникли проблемы с зависимостью от cuda. Я установил драйвер разработчика CUDA и набор инструментов CUDA от nvidia. Чтобы...

cuda gpu haskell nvidia

вопрос задан: 10 March 2012 17:44

0

ответов

cuda-memcheck, как перейти от адреса к исходному коду?

Я успешно использовал cuda-memcheck для получения ошибок о неправильном доступе к памяти. Компиляция кода cuda с -g -G дала хорошие исходные местоположения, подобные этому: ========= Ошибка: процесс не завершен ...

cuda c++ memory-management memory-leaks memcheck

вопрос задан: 8 March 2012 09:20

0

ответов

Вычисления Cuda с несколькими графическими процессорами

Я новичок в программировании для нескольких графических процессоров, и у меня есть несколько вопросов о вычислениях с несколькими графическими процессорами. Например, давайте возьмем пример скалярного произведения. Я запускаю поток ЦП, который создает 2 б

cuda dot-product multi-gpu

вопрос задан: 4 March 2012 12:38

0

ответов

Точечный продукт CUDA

Я пытаюсь реализовать классическое ядро скалярного произведения для массивов двойной точности с атомарное вычисление окончательной суммы по различным блокам. Я использовал atomicAdd для двойной точности, поскольку ...

cuda dot-product

вопрос задан: 1 March 2012 08:54

0

ответов

Тяга: Как создать device_vector из массива хоста?

Я получаю некоторые данные из библиотеки на хосте в качестве указателя на массив. Как мне создать device_vector, который хранит эти данные на устройстве? int * data; int num; get_data_from_library (& data, & num ...

thrust cuda

вопрос задан: 29 February 2012 08:13

0

ответов

Хост и устройство CUDA, использующие одну и ту же constant память

У меня есть функция устройства / хоста, которая использует постоянную память. Он работает нормально на устройстве, но на хосте кажется, что эта память остается неинициализированной. #include #include const ...

cuda

вопрос задан: 26 February 2012 21:59

0

ответов

Недопустимый аргумент в cudaMemcpy3D с использованием ширины в байтах?

Я провел простой тест texture3D и обнаружил странное поведение при копировании данных на устройство. Функция cudaMemcpy3D возвращает «недопустимый аргумент». Я обнаружил, что проблема связана с cudaExtent. ...

cuda

вопрос задан: 22 February 2012 17:03

0

ответов

как вычислить среднее значение из массива int2 с помощью Thrust

Я пытаюсь вычислить среднее значение определенного массива, который содержит точки (x, y). Можно ли использовать тягу, чтобы найти среднюю точку, представленную в виде точки (x, y)? я мог бы также представить ...

cuda average thrust

вопрос задан: 20 February 2012 16:36

0

ответов

Создание программы GPL C с модулем CUDA

Я пытаюсь изменить программу GPL, написанную на C. Моя цель - заменить один метод реализацией CUDA, что означает, что мне нужно компилировать с nvcc вместо gcc. Мне нужна помощь в создании ...

cuda makefile nvcc

вопрос задан: 20 February 2012 15:39

0

ответов

Снижение производительности при вызове ядра cuda

Мне интересно, каковы накладные расходы на выполнение вызова ядра cuda в C / C ++, например: somekernel1 <<< блоки, потоки >>> (аргументы); somekernel2 <<< блоки, потоки> & ...

c++ c cuda

вопрос задан: 19 February 2012 13:11

0

ответов

Одновременное выполнение ядер CUDA с несколькими ядрами на поток

Использование различных потоков для ядер CUDA делает возможным одновременное выполнение ядер. Поэтому n ядер на n потоках теоретически могут работать одновременно, если они вписываются в аппаратное обеспечение, ...

concurrency cuda

вопрос задан: 16 February 2012 17:57

0

ответов

Ошибка: идентификатор «blockIdx» не определен

Моя установка для CUDA Visual Studio 2010 и 2008 SP1 (требуется CUDA). Parallel NSight 1.51 CUDA 4.0 RC или 3.2 и Thrust В основном, я следовал руководству по: http: //www.ademiller.com/blogs/tech / ...

visual-studio-2010 visual-c++ cuda

вопрос задан: 10 February 2012 17:31

0

ответов

Эффективное частичное сокращение данных массивов элементов, смещений и длин sublists

В моем приложении я должен обрабатывать группу объектов (скажем, целых чисел), которые впоследствии разделяются и сортируются на более мелкие сегменты. Для этого я храню элементы в одном непрерывном массиве ...

c++ cuda thrust

вопрос задан: 1 February 2012 04:22

0

ответов

Ошибка при использовании CUDA и C++11

Я использую CUDA 4.1 и GCC 4.5 ... (ФИНАЛЬНО! CUDA поддерживает GCC 4.5, но все еще жду GCC 4.6). В любом случае, возможно ли использовать C++11 с CUDA 4.1? Я пробовал передавать: --compiler-options "-std=...

c++ gcc cuda c++11

вопрос задан: 30 January 2012 00:30

0

ответов

STL, iostream, new, удалить в C / C ++ для CUDA

Могу ли я использовать STL, iostream, new, delete в C / C ++ для CUDA?

c++ c stl cuda iostream

вопрос задан: 24 January 2012 12:19

0

ответов

Почему cudaMalloc выдает ошибку, когда я знаю, что памяти достаточно?

У меня есть Tesla C2070, которая должна иметь 5636554752 байт памяти. Однако это выдает ошибку: int *buf_d = NULL; err = cudaMalloc((void **)&buf_d, 1000000000*sizeof(int)); if( err ...

memory cuda

вопрос задан: 18 January 2012 20:45

0

ответов

Выполняется ли cudaMemcpy от хоста к устройству параллельно?

Мне любопытно, выполняется ли cudaMemcpy на CPU или GPU при копировании с хоста на устройство? Другими словами, копирование - это последовательный процесс или это делается параллельно? Позвольте мне объяснить, почему я спрашиваю ...

cuda gpgpu nvidia

вопрос задан: 13 January 2012 15:51

0

ответов

CUDA и nvcc: использование препроцессора для выбора между float и double

Проблема: Имея .h, я хочу определить real как double, если компилирую для c/c++ или для cuda с вычислительной способностью >= 1.3. Если компиляция для cuda с вычислительной способностью < 1.3, то определить ...

cuda preprocessor nvcc

вопрос задан: 10 January 2012 11:04

0

ответов

Как выбрать устройство при запуске исполняемого файла CUDA?

Я подключаюсь к кластеру графического процессора извне и не знаю, как выбрать устройство, на котором будут запускаться мои программы CUDA. Я знаю, что в кластере два GPU Tesla, и я хотел бы выбрать ...

cuda

вопрос задан: 9 January 2012 09:58

0

ответов

Текстурная память в CUDA: концепция и простой пример для демонстрации производительности

Я читаю официальный документ NVIDIA под названием «Моделирование частиц с помощью CUDA» Саймона Грина. В нем описывается пример частиц SDK и используемые алгоритмы. Обсуждая производительность кода, ...

cuda

вопрос задан: 7 January 2012 03:17

0

ответов

Необходимо ли оборудование CUDA во время компиляции?

Необходима ли установленная видеокарта с поддержкой CUDA (в Linux) для компиляции программ CUDA с nvcc? Или можно компилировать программы везде и запускать только на таких системах?

c++ c cuda gpu

вопрос задан: 2 January 2012 17:12

0

ответов

Копирование памяти, выделенной cudaMallocPitch

Может ли cudaMemcpy использоваться для памяти, выделенной cudaMallocPitch? Если нет, можете ли вы сказать, какую функцию следует использовать. cudaMallocPitch возвращает линейную память, поэтому я полагаю, что cudaMemcpy должен быть ...

memory cuda

вопрос задан: 2 January 2012 05:00

0

ответов

initializer not allowed for shared variable for cuda

Я делаю следующее: __shared__ int exForBlockLessThanP = totalElementLessThanPivotEntireBlock[blockIdx.x]; где totalElementLessThanPivotEntireBlock - массив на GPU. Компилятор ...

cuda gpgpu nvidia

вопрос задан: 24 December 2011 10:07

0

ответов

Заботится ли cudaFreeHost о том, какое устройство активно когда cudaMallocHost используется для выделения памяти?

Я использую Cuda SDK 4.0 и сталкиваюсь с проблемой, которая потребовала 2 дней, чтобы проработать следующий код. #include #include void main (int argc, ...

cuda

вопрос задан: 21 December 2011 14:41

0

ответов

Как мне получить спецификации CUDA на машине Linux?

Я обращаюсь к удаленному компьютеру с хорошей картой nVidia для вычислений CUDA, но я не могу найти способ узнать, какую карту он использует и каковы спецификации CUDA (версия и т. д.). Я использовал команду "lspci" ...

linux cuda

вопрос задан: 20 December 2011 22:32

0

ответов

Простая консольная программа не завершается, если вызывается cudaMalloc

Следующая простая программа никогда не завершается, если выполняется вызов cudaMalloc. Если закомментировать только cudaMalloc, то программа завершается нормально. #include

c++ windows cuda

вопрос задан: 16 December 2011 20:21

0

ответов

Как предоставить Matlab старую версию gcc, которую он хочет?

На моем компьютере установлена Ubuntu 10.10 с gcc 4.4.4. Я пытаюсь скомпилировать несколько файлов mex, использующих CUDA, и получаю следующее сообщение об ошибке: >> cns_build ('hmax') компиляция ... / home / leMe / hmax / cns / source / ...

matlab gcc cuda mex

вопрос задан: 15 December 2011 17:33

0

ответов

Работа с чередующимися данными в толчке

как лучше всего работать с чередующимися данными в толчке , скажем, я хочу добавить значения с длиной чередования, равной 3, например: [1, 2, 3, 4, 5, 6] даст [6, 15] или обратное чередование ...

cuda thrust

вопрос задан: 12 December 2011 22:56

0

ответов

Вызовы ядра cuda синхронны или асинхронны

Я читал, что можно использовать запуск ядра для синхронизации различных блоков, то есть, если я хочу, чтобы все блоки завершили операцию 1, прежде чем они продолжатся к операции 2 я должен поместить операцию 1 в одно ядро ...

nvidia cuda

вопрос задан: 12 December 2011 11:31