0
ответов

Копирование структуры, содержащей указатели, на устройство CUDA

Я работаю над проектом, в котором мне нужно, чтобы мое устройство CUDA выполняло вычисления в структуре, содержащей указатели. typedef struct StructA {int * arr; } StructA; Когда я выделяю память для структуры и ...
вопрос задан: 31 August 2015 03:46
0
ответов

BLAS и CUBLAS

Я задаюсь вопросом о cuBLAS Библиотеке NVIDIA. У кого-либо есть опыт с ним? Например, если я запишу программу C с помощью BLAS, то я смогу заменить вызовы к BLAS с вызовами к cuBLAS? Или...
вопрос задан: 29 July 2015 11:07
0
ответов

cudaMemcpyToSymbol() CUDA выдает ошибку «недопустимый аргумент»

Проблема Я пытаюсь скопировать массив int в постоянную память устройства, но постоянно получаю следующую ошибку : [ОШИБКА] 'неверный аргумент' (11) в 'main.cu' в строке '386' Код Там...
вопрос задан: 13 July 2015 10:07
0
ответов

Могу ли я использовать __syncthreads () после отбрасывания потоков?

Безопасно ли использовать __syncthreads () в блоке, где я намеренно отбросил потоки с помощью return? В документации указано, что __syncthreads () должен вызываться каждым потоком в блоке, иначе ...
вопрос задан: 27 May 2015 11:45
0
ответов

Расчет определителя с помощью CUDA [закрыто]

Есть ли какая-либо библиотека или свободно доступный код, который будет вычислять определитель небольшой (6x6 )матрицы двойной точности полностью на графическом процессоре?
вопрос задан: 7 April 2015 07:16
0
ответов

Как оптимальным образом транспонировать матрицу с помощью blas?

Я делаю некоторые вычисления и делаю некоторый анализ сильных и слабых сторон различных реализаций BLAS. однако я столкнулся с проблемой. Я тестирую cuBlas, выполняю linAlg на GPU ...
вопрос задан: 2 April 2015 16:29
0
ответов

Какая версия CUDA Toolkit для старого драйвера NVIDIA

Мне предоставили более старую видеокарту NVIDIA (GeForce 8400 GS), чтобы начать изучать некоторые вычисления на GPU. Я попытался успешно завершить установку, но наткнулся на проблему. ...
вопрос задан: 25 March 2015 05:46
0
ответов

NVIDIA NVCC и CUDA: Cubin vs. PTX

Я использую арку CUDA 4.0, с устройством Compute_Capability 2.0 (GTX460). В чем разница между файлами 'cubin' и 'ptx'? Я думаю, что cubin - это родной код для gpu, так что это arch. ...
вопрос задан: 13 March 2015 07:47
0
ответов

Тяга: slow_by_key медленнее, чем ожидалось

У меня есть следующий код: thrust :: device_vector unique_idxs (N); thrust :: device_vector sizes (N); thrust :: pair :: iterator, thrust :: ...
вопрос задан: 27 February 2015 12:07
0
ответов

Перегрузка переменных и операторов C ++ для приложения CUDA

У меня есть класс A, в котором я перегружаю его operator =. Однако от меня требуется сделать что-то вроде этого: volatile A x; А у; х = у; что вызвало ошибку при компиляции: no operator "=" ...
вопрос задан: 24 February 2015 20:23
0
ответов

Нахождение максимального значения элемента И его положения с помощью CUDA Thrust

Как мне получить не только значение, но и положение максимального (минимального) элемента (res.val и res.pos)? thust :: host_vector h_vec (100); thust :: generate (h_vec.begin (), h_vec.end (), ...
вопрос задан: 18 February 2015 22:28
0
ответов

указатели функций устройства

Мне нужна следующая версия устройства код хоста: double (** func) (double x); двойной func1 (двойной x) {return x + 1 .; } double func2 (двойной x) {return x + 2 .; } double func3 (двойной x) {return x + ...
вопрос задан: 17 December 2014 15:23
0
ответов

Расчет времени для операций CUDA

Мне нужно рассчитать время выполнения ядра CUDA. В «Руководстве по передовой практике» говорится, что мы можем использовать в Windows как события, так и стандартные функции времени, такие как clock (). Моя проблема в том, что при использовании этих двух
вопрос задан: 19 November 2014 16:21
0
ответов

Повышение производительности ядра за счет увеличения занятости?

Вот результат работы Compute Visual Profiler для моего ядра на GT 440: Сведения о ядре: Размер сетки: [100 1 1], Размер блока : [256 1 1] Соотношение регистров: 0,84375 (27648/32768) [35 регистров на поток] ...
вопрос задан: 11 September 2014 21:23
0
ответов

Плавающие точки половинной точности в CUDA

Есть ли что-нибудь вроде плавающих точек половинной точности в CUDA? Предпосылки: я хочу управлять текстурой opengl с помощью glTexSubImage3D с данными из PBO, которые я генерирую с помощью CUDA. Текстура ...
вопрос задан: 17 June 2014 11:22
0
ответов

Передача данных между родительским окном и дочерним всплывающим окном с помощью jQuery

У меня есть следующий HTML-код Партнерская программа < / td>
вопрос задан: 7 May 2014 17:01
0
ответов

Как эффективно собирать данные из потоков в CUDA?

У меня есть приложение, которое решает систему уравнений в CUDA, я точно знаю, что каждый поток может найти до 4-х решений, но как потом скопировать обратно на хост? Я передаю огромный массив с...
вопрос задан: 24 January 2014 16:26
0
ответов

Python Multiprocessing with PyCUDA

I've got a problem that I want to split across multiple CUDA devices, but I suspect my current system architecture is holding me back; What I've set up is a GPU class, with functions that perform ...
вопрос задан: 23 January 2014 15:32
0
ответов

Какие IDE имеют хорошую поддержку программирования с CUDA? [закрыто]

Я начинаю программировать на CUDA C. Есть ли какие-нибудь IDE, которые особенно подходят для программирования на нем? Я использую машину с Windows и личный macbook: D (Но я хочу знать, какие люди ...
вопрос задан: 10 January 2014 18:15
0
ответов

Ошибка при простой компиляции cuda

FSPB_main.cpp int main (int args, char * argv []) {....... float * d_a ; cudaMalloc ((void **) & d_a, 5 * sizeof (float)); } $ nvcc -L / usr / local / cuda / lib -lcutil -lcudpp -lcuda -...
вопрос задан: 24 December 2013 13:01
0
ответов

cuda обнаружена неисправимая ошибка ECC

Моя среда - Windows 7 x64 Матлаб 2012а x64 Куда SDK 4.2 Графический процессор Tesla C2050 Мне трудно понять, почему мой графический процессор дает сбой из-за «обнаружена неисправимая ошибка ECC». Эта ошибка только...
вопрос задан: 16 December 2013 23:17
0
ответов

Правильно ли установлен CUDA на моем Ubuntu 10.04? Некоторые образцы не запускаются.

Я пытаюсь установить CUDA на сервер под управлением Ubuntu 10.04. Я следовал инструкциям NVDIA и установил «Набор инструментов CUDA для Ubuntu Linux 10.04», «Примеры кода SDK для работы с GPU» и «...
вопрос задан: 14 December 2013 00:01
0
ответов

Что означает «вычислительная мощность» по отношению к. CUDA?

Я новичок в программировании CUDA и мало что об этом знаю. Не могли бы вы рассказать мне, что означает «вычислительная способность CUDA»? Когда я использую следующий код на своем университетском сервере, он показывает мне...
вопрос задан: 9 December 2013 15:22
0
ответов

Как я могу сложить два 2d (разбитых) массива, используя вложенные для петли?

Я новичок в cuda. Я хочу добавить два 2d массива в третий массив. Я использую следующий код: cudaMallocPitch ((void **) & device_a, & pitch, 2 * sizeof (int), 2); cudaMallocPitch ((void **) & device_b, & ...
вопрос задан: 2 December 2013 07:12
0
ответов

CUDA: как проверить правильность вычислений?

Код CUDA, скомпилированный с более высокими вычислительными возможностями, будет отлично работать в течение долгого времени на устройстве с более низкими вычислительными возможностями, прежде чем однажды тихо выйдет из строя в каком-то ядре. Я потратил
вопрос задан: 8 October 2013 07:44
0
ответов

Как остановить сбой Matlab при (неправильном) выполнении mex-файла с функциональностью CUDA

В настоящее время я разрабатываю mex-файл с функциональностью CUDA для использования в MATLAB. Когда я делаю что-то не так (например, неправильные указатели или что-то в этом роде), MATLAB всегда дает сбой (окна подсказывают мне ...
вопрос задан: 7 October 2013 20:49
0
ответов

Почему не удается найти libcudart.so.4 при компиляции образцов CUDA в Ubuntu?

Я пытаюсь запустить образцы Cuda SDK, но получаю следующую ошибку: ./bandwidthTest: ошибка при загрузке общих библиотек: libcudart.so.4: невозможно открыть общий объектный файл: ...
вопрос задан: 11 June 2013 14:24
0
ответов

Как и когда я должен использовать наклонный указатель с API CUDA?

Я достаточно хорошо понимаю, как распределять и копировать линейную память с помощью cudaMalloc () и cudaMemcpy (). Однако, когда я хочу использовать функции CUDA для выделения и копирования 2D или 3D матриц, ...
вопрос задан: 16 May 2013 07:39
0
ответов

Какой алгоритм использует преобразование Байера OpenCV?

Я хотел бы реализовать алгоритм преобразования изображения GPU Bayer в RGB, и мне было интересно, какой алгоритм использует функция OpenCV cvtColor. Глядя на источник, я вижу, что это переменная...
вопрос задан: 16 May 2013 02:05
0
ответов

Примеры CUDA SDK вызывают различные ошибки в системе с несколькими -GPU

У меня есть стойка Dell Precision с Ubuntu Precise и двумя Tesla C2075 плюс Quadro 600, который является устройством отображения. Недавно я закончил несколько тестов на своем настольном -компьютере и теперь...
вопрос задан: 23 February 2013 06:00