Is it possible to dynamically allocate memory on a GPU's Global memory inside the Kernel?
Я не знаю, насколько большим будет мой ответ, поэтому мне нужен способ выделить память для каждой части ответа. ...
В приведенном ниже символе я сравниваю результаты выполнения IFFT в FFTW и CUFFT. Каковы возможные причины, по которым это выходит иначе? Неужели это ТАКАЯ большая ошибка округления? ...
Я немного погуглил, но сейчас мне непонятно, могут ли некоторые графические процессоры, запрограммированные с помощью CUDA, использовать преимущества или могут использовать инструкции, похожие на от расширений SSE SIMD; например ...
Я подхожу к тому моменту, когда мне нужно начать кэширование вещей, и это заставило меня задуматься. .. В некоторых частях приложения я визуализирую строки таблицы (jqGrid, slickgrid и т. Д.) Или причудливые строки div (например, в ...
В CUDA мы можем использовать закрепленную память для более эффективного использования скопируйте данные с хоста на графический процессор, чем память по умолчанию, выделенная через malloc на хосте. Однако есть два типа закрепленной памяти по умолчанию ...
В настоящее время я использую инструмент, поставляемый с драйвером nvidia-smi от nvidia для мониторинга производительности на графическом процессоре. Когда мы используем 'nvidia-smi -a', он предоставляет информацию о текущей информации о графическом проц
Я использую калькулятор занятости, но не могу понять, как получить Registers per thread / shared memory per block .I read the documentation.I use visual studio .So in the project properties under ...
Я пытаюсь понять, подходит ли использование cudaHostAlloc (или cudaMallocHost?). Я пытаюсь запустить ядро, в котором мои входные данные превышают количество, доступное на GPU. Могу ли я ...
Приложение D версии 3.2 документации CUDA относится к поддержке C ++ в коде устройства CUDA.
Ясно упомянуто, что CUDA поддерживает «Классы для устройств с вычислительной способностью 2.x». Однако ...
Для разработки программ NVIDIA CUDA необходимы следующие инструменты: Драйверы разработчика
Набор инструментов CUDA
SDK для вычислений на GPU Что это за драйвер разработчика? Его установка автоматически отменяет любой графический драйвер NVIDIA ...
Я пытался выяснить, как сделать то, что, как я думал, было бы простым ядром, которое принимало бы среднее значение значений в 2-мерная матрица, но у меня возникают некоторые проблемы с ясным мышлением ...
У меня есть функция многократного использования в некотором коде CUDA, которую необходимо вызывать как с устройства, так и с хоста. Есть ли для этого подходящая квалификация? например, какое правильное определение для func1 в ...
Является ли есть ли способ в CUDA выделить память в функции __device__? Я не мог найти никаких примеров этого. Из руководства: B.15 Распределение динамической глобальной памяти
void * malloc (size_t size); ...
Я пытаюсь выяснить, является ли определенная проблема подходящим кандидатом для использования CUDA, чтобы перенести проблему на графический процессор. По сути, я делаю блочный фильтр, который меняется в зависимости от обнаружения края. Итак ...
При компиляции кода CUDA вы должны выбрать, для какой архитектуры создается ваш код. nvcc предоставляет два параметра для определения этой архитектуры, в основном: arch указывает виртуальный ...
Я бы хотел услышать мнение людей, имеющих опыт программирования для обоих. Лично у меня только опыт работы с NVIDIA. NVIDIA CUDA кажется намного более популярной, чем конкуренты. (Просто считая вопрос ...
Есть много подходов, когда речь идет о запуске ненадежного кода на типичном ЦП: песочницы, поддельные корни, виртуализация ... А как насчет ненадежного кода для GPGPU (OpenCL, cuda или уже скомпилированный) ...
У меня проблема с использованием malloc. У меня есть функция jacobi_gpu, которая вызывается много раз: int main (int argc, char * argv []) {/ * ... * / int totalrot = 0; while (nrot> 0) {...
Я написал это ядро CUDA. для Конвея ' s игра жизни: __global__ void gameOfLife (float * returnBuffer, int width, int height) {unsigned int x = blockIdx.x * blockDim.x + threadIdx.x; ...
Я установил последнюю версию nvidia sdk и инструментарий. Когда я запускаю любой из этих примеров sdk, я получаю следующую ошибку: / usr / bin / ld: cannot find -lcutil_x86_64 Любая помощь будет принята с благодарностью.
Я работаю над проект с CUDA. Чтобы понять это, у меня есть следующий код. #include с использованием пространства имен std; __global__ void inc (int * foo) {++ (* foo);
} int main () {...
I'm going to attempt to optimize some code written in MATLAB, by using CUDA. I recently started programming CUDA, but I've got a general idea of how it works. So, say I want to add two matrices ...
Я новичок в CUDA парадигма. Мой вопрос заключается в определении количества потоков на блок и блоков на сетку. Есть ли здесь немного искусства и проб? Я обнаружил, что во многих примерах есть ...
I am working on a project where I'm basically preforming PCA millions of times on sets of 20-100 points. Currently, we are using some legacy code that is using GNU's GSL linear algebra pack to do SVD ...
Это довольно простой вопрос, но поиск в Google, похоже, не дает ответа, так что. Я хочу знать, есть ли у меня две карты gpu (одинаковые), способные запускать cuda, может ли мое ядро охватывать эти карты? ...
Я изучаю CUDA, и у меня есть кое-что вот так на данный момент. __device__ void iterate_temperatures (int fieldSize, Atom * atom) {int temperature = threadIdx.x + blockDim.x * blockIdx.x; ...
Я использую OpenCL для написания ядер GPGPU, нацеленных на среду выполнения NVidia CUDA. Я недавно читал о V8 и нашел страницу, описывающую методы встраивания V8: http://code.google.com/apis/v8/...
Я собираюсь начать крупномасштабный программный проект, включающий кроссплатформенный графический интерфейс и тяжелый числовой хруст. Я планирую написать большую часть серверной части приложения на C ++ и CUDA, а графический интерфейс - в ...
Я новичок в CUDA C и пытаюсь передать структуру typedef'd в ядро. Мой метод работал нормально, когда я пробовал его со структурой, содержащей только целые числа, но когда я переключаюсь на числа с плавающей запятой, я теряю смысл ...