Я работаю над проектом, в котором мне нужно, чтобы мое устройство CUDA выполняло вычисления в структуре, содержащей указатели. typedef struct StructA {int * arr;
} StructA; Когда я выделяю память для структуры и ...
Я задаюсь вопросом о cuBLAS Библиотеке NVIDIA. У кого-либо есть опыт с ним? Например, если я запишу программу C с помощью BLAS, то я смогу заменить вызовы к BLAS с вызовами к cuBLAS? Или...
Проблема Я пытаюсь скопировать массив int в постоянную память устройства, но постоянно получаю следующую ошибку : [ОШИБКА] 'неверный аргумент' (11) в 'main.cu' в строке '386' Код Там...
Безопасно ли использовать __syncthreads () в блоке, где я намеренно отбросил потоки с помощью return? В документации указано, что __syncthreads () должен вызываться каждым потоком в блоке, иначе ...
Есть ли какая-либо библиотека или свободно доступный код, который будет вычислять определитель небольшой (6x6 )матрицы двойной точности полностью на графическом процессоре?
Я делаю некоторые вычисления и делаю некоторый анализ сильных и слабых сторон различных реализаций BLAS. однако я столкнулся с проблемой. Я тестирую cuBlas, выполняю linAlg на GPU ...
Мне предоставили более старую видеокарту NVIDIA (GeForce 8400 GS), чтобы начать изучать некоторые вычисления на GPU. Я попытался успешно завершить установку, но наткнулся на проблему. ...
Я использую арку CUDA 4.0, с устройством Compute_Capability 2.0 (GTX460).
В чем разница между файлами 'cubin' и 'ptx'?
Я думаю, что cubin - это родной код для gpu, так что это arch. ...
У меня есть класс A, в котором я перегружаю его operator =. Однако от меня требуется сделать что-то вроде этого: volatile A x;
А у;
х = у; что вызвало ошибку при компиляции: no operator "=" ...
Как мне получить не только значение, но и положение максимального (минимального) элемента (res.val и res.pos)? thust :: host_vector h_vec (100);
thust :: generate (h_vec.begin (), h_vec.end (), ...
Мне нужно рассчитать время выполнения ядра CUDA. В «Руководстве по передовой практике» говорится, что мы можем использовать в Windows как события, так и стандартные функции времени, такие как clock (). Моя проблема в том, что при использовании этих двух
Вот результат работы Compute Visual Profiler для моего ядра на GT 440: Сведения о ядре: Размер сетки: [100 1 1], Размер блока : [256 1 1]
Соотношение регистров: 0,84375 (27648/32768) [35 регистров на поток]
...
Есть ли что-нибудь вроде плавающих точек половинной точности в CUDA? Предпосылки: я хочу управлять текстурой opengl с помощью glTexSubImage3D с данными из PBO, которые я генерирую с помощью CUDA. Текстура ...
У меня есть приложение, которое решает систему уравнений в CUDA, я точно знаю, что каждый поток может найти до 4-х решений, но как потом скопировать обратно на хост? Я передаю огромный массив с...
I've got a problem that I want to split across multiple CUDA devices, but I suspect my current system architecture is holding me back; What I've set up is a GPU class, with functions that perform ...
Я начинаю программировать на CUDA C. Есть ли какие-нибудь IDE, которые особенно подходят для программирования на нем? Я использую машину с Windows и личный macbook: D (Но я хочу знать, какие люди ...
Моя среда - Windows 7 x64 Матлаб 2012а x64 Куда SDK 4.2 Графический процессор Tesla C2050 Мне трудно понять, почему мой графический процессор дает сбой из-за «обнаружена неисправимая ошибка ECC». Эта ошибка только...
Я пытаюсь установить CUDA на сервер под управлением Ubuntu 10.04. Я следовал инструкциям NVDIA и установил «Набор инструментов CUDA для Ubuntu Linux 10.04», «Примеры кода SDK для работы с GPU» и «...
Я новичок в программировании CUDA и мало что об этом знаю. Не могли бы вы рассказать мне, что означает «вычислительная способность CUDA»? Когда я использую следующий код на своем университетском сервере, он показывает мне...
Я новичок в cuda. Я хочу добавить два 2d массива в третий массив.
Я использую следующий код: cudaMallocPitch ((void **) & device_a, & pitch, 2 * sizeof (int), 2);
cudaMallocPitch ((void **) & device_b, & ...
Код CUDA, скомпилированный с более высокими вычислительными возможностями, будет отлично работать в течение долгого времени на устройстве с более низкими вычислительными возможностями, прежде чем однажды тихо выйдет из строя в каком-то ядре. Я потратил
В настоящее время я разрабатываю mex-файл с функциональностью CUDA для использования в MATLAB. Когда я делаю что-то не так (например, неправильные указатели или что-то в этом роде), MATLAB всегда дает сбой (окна подсказывают мне ...
Я пытаюсь запустить образцы Cuda SDK, но получаю следующую ошибку: ./bandwidthTest: ошибка при загрузке общих библиотек: libcudart.so.4: невозможно открыть общий объектный файл: ...
Я достаточно хорошо понимаю, как распределять и копировать линейную память с помощью cudaMalloc () и cudaMemcpy (). Однако, когда я хочу использовать функции CUDA для выделения и копирования 2D или 3D матриц, ...
Я хотел бы реализовать алгоритм преобразования изображения GPU Bayer в RGB, и мне было интересно, какой алгоритм использует функция OpenCV cvtColor. Глядя на источник, я вижу, что это переменная...
У меня есть стойка Dell Precision с Ubuntu Precise и двумя Tesla C2075 плюс Quadro 600, который является устройством отображения. Недавно я закончил несколько тестов на своем настольном -компьютере и теперь...