0
ответов

CUDA, как получить сетку, блок, размер потока и параллельное вычисление неквадратной матрицы

Я новичок в CUDA и мне нужна помощь в понимании некоторых вещей. Мне нужна помощь в распараллеливании этих двух циклов for. В частности, как настроить dimBlock и dimGrid, чтобы это работало быстрее. Я знаю это ...
вопрос задан: 11 March 2012 20:24
0
ответов

при установке модуля cuda не удается найти библиотеку драйверов cuda

Я пытаюсь установить модуль ускорения Мануэля Чакраварти, но у меня возникли проблемы с зависимостью от cuda. Я установил драйвер разработчика CUDA и набор инструментов CUDA от nvidia. Чтобы...
вопрос задан: 10 March 2012 17:44
0
ответов

cuda-memcheck, как перейти от адреса к исходному коду?

Я успешно использовал cuda-memcheck для получения ошибок о неправильном доступе к памяти. Компиляция кода cuda с -g -G дала хорошие исходные местоположения, подобные этому: ========= Ошибка: процесс не завершен ...
вопрос задан: 8 March 2012 09:20
0
ответов

Вычисления Cuda с несколькими графическими процессорами

Я новичок в программировании для нескольких графических процессоров, и у меня есть несколько вопросов о вычислениях с несколькими графическими процессорами. Например, давайте возьмем пример скалярного произведения. Я запускаю поток ЦП, который создает 2 б
вопрос задан: 4 March 2012 12:38
0
ответов

Точечный продукт CUDA

Я пытаюсь реализовать классическое ядро ​​скалярного произведения для массивов двойной точности с атомарное вычисление окончательной суммы по различным блокам. Я использовал atomicAdd для двойной точности, поскольку ...
вопрос задан: 1 March 2012 08:54
0
ответов

Тяга: Как создать device_vector из массива хоста?

Я получаю некоторые данные из библиотеки на хосте в качестве указателя на массив. Как мне создать device_vector, который хранит эти данные на устройстве? int * data; int num; get_data_from_library (& data, & num ...
вопрос задан: 29 February 2012 08:13
0
ответов

Хост и устройство CUDA, использующие одну и ту же __constant__ память

У меня есть функция устройства / хоста, которая использует постоянную память. Он работает нормально на устройстве, но на хосте кажется, что эта память остается неинициализированной. #include #include const ...
вопрос задан: 26 February 2012 21:59
0
ответов

Недопустимый аргумент в cudaMemcpy3D с использованием ширины в байтах?

Я провел простой тест texture3D и обнаружил странное поведение при копировании данных на устройство. Функция cudaMemcpy3D возвращает «недопустимый аргумент». Я обнаружил, что проблема связана с cudaExtent. ...
вопрос задан: 22 February 2012 17:03
0
ответов

как вычислить среднее значение из массива int2 с помощью Thrust

Я пытаюсь вычислить среднее значение определенного массива, который содержит точки (x, y). Можно ли использовать тягу, чтобы найти среднюю точку, представленную в виде точки (x, y)? я мог бы также представить ...
вопрос задан: 20 February 2012 16:36
0
ответов

Создание программы GPL C с модулем CUDA

Я пытаюсь изменить программу GPL, написанную на C. Моя цель - заменить один метод реализацией CUDA, что означает, что мне нужно компилировать с nvcc вместо gcc. Мне нужна помощь в создании ...
вопрос задан: 20 February 2012 15:39
0
ответов

Снижение производительности при вызове ядра cuda

Мне интересно, каковы накладные расходы на выполнение вызова ядра cuda в C / C ++, например: somekernel1 <<< блоки, потоки >>> (аргументы); somekernel2 <<< блоки, потоки> & ...
вопрос задан: 19 February 2012 13:11
0
ответов

Одновременное выполнение ядер CUDA с несколькими ядрами на поток

Использование различных потоков для ядер CUDA делает возможным одновременное выполнение ядер. Поэтому n ядер на n потоках теоретически могут работать одновременно, если они вписываются в аппаратное обеспечение, ...
вопрос задан: 16 February 2012 17:57
0
ответов

Ошибка: идентификатор «blockIdx» не определен

Моя установка для CUDA Visual Studio 2010 и 2008 SP1 (требуется CUDA). Parallel NSight 1.51 CUDA 4.0 RC или 3.2 и Thrust В основном, я следовал руководству по: http: //www.ademiller.com/blogs/tech / ...
вопрос задан: 10 February 2012 17:31
0
ответов

Эффективное частичное сокращение данных массивов элементов, смещений и длин sublists

В моем приложении я должен обрабатывать группу объектов (скажем, целых чисел), которые впоследствии разделяются и сортируются на более мелкие сегменты. Для этого я храню элементы в одном непрерывном массиве ...
вопрос задан: 1 February 2012 04:22
0
ответов

Ошибка при использовании CUDA и C++11

Я использую CUDA 4.1 и GCC 4.5 ... (ФИНАЛЬНО! CUDA поддерживает GCC 4.5, но все еще жду GCC 4.6). В любом случае, возможно ли использовать C++11 с CUDA 4.1? Я пробовал передавать: --compiler-options "-std=...
вопрос задан: 30 January 2012 00:30
0
ответов

STL, iostream, new, удалить в C / C ++ для CUDA

Могу ли я использовать STL, iostream, new, delete в C / C ++ для CUDA?
вопрос задан: 24 January 2012 12:19
0
ответов

Почему cudaMalloc выдает ошибку, когда я знаю, что памяти достаточно?

У меня есть Tesla C2070, которая должна иметь 5636554752 байт памяти. Однако это выдает ошибку: int *buf_d = NULL; err = cudaMalloc((void **)&buf_d, 1000000000*sizeof(int)); if( err ...
вопрос задан: 18 January 2012 20:45
0
ответов

Выполняется ли cudaMemcpy от хоста к устройству параллельно?

Мне любопытно, выполняется ли cudaMemcpy на CPU или GPU при копировании с хоста на устройство? Другими словами, копирование - это последовательный процесс или это делается параллельно? Позвольте мне объяснить, почему я спрашиваю ...
вопрос задан: 13 January 2012 15:51
0
ответов

CUDA и nvcc: использование препроцессора для выбора между float и double

Проблема: Имея .h, я хочу определить real как double, если компилирую для c/c++ или для cuda с вычислительной способностью >= 1.3. Если компиляция для cuda с вычислительной способностью < 1.3, то определить ...
вопрос задан: 10 January 2012 11:04
0
ответов

Как выбрать устройство при запуске исполняемого файла CUDA?

Я подключаюсь к кластеру графического процессора извне и не знаю, как выбрать устройство, на котором будут запускаться мои программы CUDA. Я знаю, что в кластере два GPU Tesla, и я хотел бы выбрать ...
вопрос задан: 9 January 2012 09:58
0
ответов

Текстурная память в CUDA: концепция и простой пример для демонстрации производительности

Я читаю официальный документ NVIDIA под названием «Моделирование частиц с помощью CUDA» Саймона Грина. В нем описывается пример частиц SDK и используемые алгоритмы. Обсуждая производительность кода, ...
вопрос задан: 7 January 2012 03:17
0
ответов

Необходимо ли оборудование CUDA во время компиляции?

Необходима ли установленная видеокарта с поддержкой CUDA (в Linux) для компиляции программ CUDA с nvcc? Или можно компилировать программы везде и запускать только на таких системах?
вопрос задан: 2 January 2012 17:12
0
ответов

Копирование памяти, выделенной cudaMallocPitch

Может ли cudaMemcpy использоваться для памяти, выделенной cudaMallocPitch? Если нет, можете ли вы сказать, какую функцию следует использовать. cudaMallocPitch возвращает линейную память, поэтому я полагаю, что cudaMemcpy должен быть ...
вопрос задан: 2 January 2012 05:00
0
ответов

initializer not allowed for __shared__ variable for cuda

Я делаю следующее: __shared__ int exForBlockLessThanP = totalElementLessThanPivotEntireBlock[blockIdx.x]; где totalElementLessThanPivotEntireBlock - массив на GPU. Компилятор ...
вопрос задан: 24 December 2011 10:07
0
ответов

Заботится ли cudaFreeHost о том, какое устройство активно когда cudaMallocHost используется для выделения памяти?

Я использую Cuda SDK 4.0 и сталкиваюсь с проблемой, которая потребовала 2 дней, чтобы проработать следующий код. #include #include void main (int argc, ...
вопрос задан: 21 December 2011 14:41
0
ответов

Как мне получить спецификации CUDA на машине Linux?

Я обращаюсь к удаленному компьютеру с хорошей картой nVidia для вычислений CUDA, но я не могу найти способ узнать, какую карту он использует и каковы спецификации CUDA (версия и т. д.). Я использовал команду "lspci" ...
вопрос задан: 20 December 2011 22:32
0
ответов

Простая консольная программа не завершается, если вызывается cudaMalloc

Следующая простая программа никогда не завершается, если выполняется вызов cudaMalloc. Если закомментировать только cudaMalloc, то программа завершается нормально. #include
вопрос задан: 16 December 2011 20:21
0
ответов

Как предоставить Matlab старую версию gcc, которую он хочет?

На моем компьютере установлена ​​Ubuntu 10.10 с gcc 4.4.4. Я пытаюсь скомпилировать несколько файлов mex, использующих CUDA, и получаю следующее сообщение об ошибке: >> cns_build ('hmax') компиляция ... / home / leMe / hmax / cns / source / ...
вопрос задан: 15 December 2011 17:33
0
ответов

Работа с чередующимися данными в толчке

как лучше всего работать с чередующимися данными в толчке , скажем, я хочу добавить значения с длиной чередования, равной 3, например: [1, 2, 3, 4, 5, 6] даст [6, 15] или обратное чередование ...
вопрос задан: 12 December 2011 22:56
0
ответов

Вызовы ядра cuda синхронны или асинхронны

Я читал, что можно использовать запуск ядра для синхронизации различных блоков, то есть, если я хочу, чтобы все блоки завершили операцию 1, прежде чем они продолжатся к операции 2 я должен поместить операцию 1 в одно ядро ​​...
вопрос задан: 12 December 2011 11:31