2
ответа

Результаты добавления 2D сетки и блока CUDA 0 [дублировать]

Следующий код CUDA выводит 0 как вывод, тогда как если я запустил код с комментариями, результат будет правильным. Я запускаю код на GTX 750 Ti на окнах 10x64 с сообществом Visual Studio 2017 ...
вопрос задан: 23 May 2017 10:31
2
ответа

Реализация критического раздела в CUDA

Я пытаюсь реализовать критический раздел в CUDA использование атомарных инструкций, но я столкнулся с некоторой проблемой. Я создал тестовую программу для показа проблемы: #include <cuda_runtime.h> #...
вопрос задан: 13 April 2017 16:42
2
ответа

Ускорение GPU Numba на & ldquo; Высокопроизводительный GPU & rdquo; вместо интегрированных? Python-3.x [дубликат]

Я только начал с Numba и использовал пример Mandelbrot, и чтобы убедиться, что он работает на графическом процессоре, я открыл диспетчер задач и увидел, что этот код использует встроенный графический процессор (GPU 0) вместо ...
вопрос задан: 18 June 2016 05:55
2
ответа

Как заставить различные потоки выполнить различные части в CUDA?

Я работаю над CUDA, и мне связали проблему для поточной обработки синхронизации. В моем коде мне нужны потоки для выполнения различных частей кода, как: один поток-> весь поток-> один поток->...
вопрос задан: 20 February 2016 14:55
2
ответа

Понимая размеры сетки CUDA, наибольшие главные размерения и организацию потоков (простое объяснение) [закрытый]

Как потоки организованы, чтобы быть выполненными GPU?
вопрос задан: 20 February 2016 08:23
2
ответа

Возможно ли завершить работу ядра CUDA с хоста? [Дубликат]

Я хочу прекратить работу ядра CUDA (A), я хочу немедленно запустить другое ядро ​​с более высоким приоритетом (B). Возможно ли это (или что-то вроде установки сторожевого таймера перед запуском (A) ...
вопрос задан: 25 January 2016 11:29
2
ответа

Я использую cusolver для выполнения svd, но когда я компилирую свой код, я получаю эту ошибку компоновщика [duplicate]

Это мой код: #include "cuda_runtime.h" #include "device_launch_parameters.h" #include & lt; stdio.h & gt; #include & lt; iostream & gt; #include & lt; stdlib.h & gt; #include & lt; cusolverDn.h & gt; #включают &...
вопрос задан: 2 December 2015 02:36
2
ответа

Примеры cuBLAS, внешний символ не разрешен, VS2015 [дубликат]

Я пытаюсь скомпилировать и запустить следующий код, взятый из руководства cuBLAS. // Пример 2. Применение с использованием C и CUBLAS: индексирование на основе 0 // --------------------------------- -----------------------...
вопрос задан: 2 December 2015 02:36
2
ответа

Используя openMP в cuda размещают код?

Это это возможный использовать openMP прагмы в CUDA-файлах (не в коде ядра)? Я объединю вычисление CPU и gpu. Но сбои компилятора nvvc с "не могут найти опцию Unknown 'openmp'", если я...
вопрос задан: 28 October 2015 12:02
2
ответа

переменные cudamalloc vs __device__ [duplicate]

Мой вопрос в чем разница между переменными, использующими переменные cudaMalloc и глобальные переменные __device__? Я хочу знать, есть ли разница в: производительности, как распределяется память для ...
вопрос задан: 30 October 2013 03:17
2
ответа

Python - загрузка файлов в память с помощью CUDA? [Дубликат]

Недавно я узнал о программировании CUDA на python, и мне было интересно, можно ли быстрее загружать файлы в память с помощью GPU. Я особенно стараюсь найти способ быстрее загружать наборы данных ML. ...
вопрос задан: 25 October 2013 13:50
2
ответа

Какая функция cublas позволит мне выполнить добавление матрицы? [Дубликат]

Я читаю документацию CUBLAS_Library, пытаясь выяснить, какие функции позволят мне выполнять базовые операции с матрицами. Самое близкое, что я вижу, это функция cublas & lt; t & gt; ...
вопрос задан: 11 September 2012 13:48
2
ответа

Как выделить в cudaMalloc & hellip ;? [Дубликат]

все. Мне интересно, как выделить двойной указатель на cuda. Мой код ниже. ------------ это структура --- вершинная вершина structped typedef; struct vertex {unsigned int vertex_id; ...
вопрос задан: 9 August 2012 13:05
2
ответа

Одновременный запуск Нескольких Ядер с помощью CUDA для GPU

Действительно ли возможно запустить два ядра, которые делают независимые задачи, одновременно. Например, если я сделал, чтобы этот Cuda кодировал//хост и инициализация устройства..............//kernel1 myMethod1 запуска <...
вопрос задан: 12 July 2012 19:27
2
ответа

Исходные файлы CUDA получают .cu расширение. Что получают заголовочные файлы?

Стандартная конвенция, кажется, чтобы дать файлам исходного кода CUDA .cu расширение, отличить их из файлов C с.c расширением. Какова соответствующая конвенция для CUDA-определенного заголовка...
вопрос задан: 11 June 2012 10:27
2
ответа

Как я выполняю код MATLAB GPU с помощью CUDA?

Я хочу выполнить код MATLAB CUDA NVIDIA использования GPU. Я нашел несколько сторонних механизмов: Конверт GPUMat кто-либо рекомендовал бы их или является там лучшими там? Любые подсказки или...
вопрос задан: 4 April 2012 01:20
2
ответа

Самая простая обертка CUDA для новичков

Я хочу начать изучать, как программировать в CUDA, не только языке, но и проектировании программы - вещах как - от того, что я услышал - запись ядер без условных выражений так, чтобы все выполненные потоки...
вопрос задан: 18 March 2012 10:42
2
ответа

Простейший возможный пример, показывающий, как GPU превосходит CPU с помощью CUDA

Я ищу максимально сжатый объем кода, который можно кодировать как для процессора (используя g ++), так и для графического процессора (используя nvcc), для которого графический процессор последовательно превосходит центральный процессор. Любой тип алгоритм
вопрос задан: 5 October 2011 15:42
2
ответа

Как возвратить единственную переменную из функции ядра CUDA?

У меня есть функция поиска CUDA, которые вычисляют одну единственную переменную. Как я могу возвратить его назад. __ глобальный __ освобождают G_SearchByNameID (узел*, Узел, длинный nodeCount, долго запускается, символ* dest, длинный ответ) {...
вопрос задан: 17 August 2011 03:33
2
ответа

CUDA: Как утверждать в коде ядра?

Что такое эквивалентная техника утверждения в коде ядра CUDA? Похоже, что для кода ядра CUDA нет утверждения. Мне нужен способ легко отлавливать ошибки программиста в коде ядра. А ...
вопрос задан: 1 July 2011 20:58
2
ответа

Операции с вектором, поддерживаемые в Hardware от Nvidia GPUS [дубликат]

Поскольку Intel CPUS имеет набор инструкций AVX, который использует регистры XMM размером 256/512 байт для выполнения векторной операции с данными. Поддерживает ли Nvidia любую такую ​​векторную операцию, я хотел бы работать с 128 / ...
вопрос задан: 8 March 2011 22:48
2
ответа

определите переменный размер на массиве в локальной памяти, с помощью CUDA

Действительно ли несколько возможно войти в список, массив, что-то в устройстве функционирует с размером списка/массива, являющегося параметром в вызове … или глобальная переменная, это инициализируется во время вызова? Я...
вопрос задан: 10 July 2010 19:45
2
ответа

Компиляция примеров NVIDIA CUDA SDK Неподдерживаемая архитектура 'compute_20'

При компиляции CUDA SDK я получаю nvcc фатальный: Неподдерживаемая архитектура gpu 'compute_20' Мой инструментарий - 2.3 и в общей системе (то есть не могу обновить), а также версия драйвера ...
вопрос задан: 15 June 2010 21:24
2
ответа

Переопределите NVCC_COMPILE_FLAGS для одной цели - как правильно? [Дубликат]

В CMakeLists.txt для моего проекта CUDA я установил (CUDA_NVCC_FLAGS -some -flags -here). Для одной из нескольких целей я хочу скомпилировать с разными флагами. Каков правильный путь для меня .. ,
вопрос задан: 16 May 2010 09:49
2
ответа

Пытаясь 'Сделать' SDK CUDA, ld не может найти, что библиотека, ldconfig говорит, что может

Я знаю, что существует много других вопросов, подобных этому, но ни одно из решений, устанавливаемых там, не работает на меня В основном, делая файлы примера SDK, я получаю/usr/bin/ld: не может найти-lcuda...
вопрос задан: 26 April 2010 19:52
2
ответа

алгоритмы графика на GPU

текущие потоки GPU так или иначе ограничены (предел памяти, предел структур данных, никакая рекурсия...). Вы думаете, что было бы выполнимо реализовать проблему теории графов на GPU. например...
вопрос задан: 12 March 2010 08:17
2
ответа

программа cuda на VMware

я записал cuda программу, и я тестирую ее на человечности как виртуальная машина. причина этого, у меня есть окна 7, я не хочу устанавливать человечность как вторичную операционную систему, и я должен использовать...
вопрос задан: 14 February 2010 11:41
2
ответа

помогите мне понять cuda

я испытываю некоторые затруднения при понимании, что потоки в NVIDIA gpu архитектура с cuda. могли кто-либо разъяснять их информация: 8800 gpu имеют 16 SMS с 8 SPS каждый. таким образом, у нас есть 128 SPS, я был...
вопрос задан: 5 February 2010 12:37
2
ответа

CUDA выделение массива массивов

Я испытываю некоторые затруднения из-за, выделяют массив массивов в CUDA. пусто ** данные; cudaMalloc (&data, sizeof (освобождают **) *N);//выделяет без проблем для (интервал i = 0; я <N; я ++) {cudaMalloc (данные + я...
вопрос задан: 2 December 2009 20:21
2
ответа

CUDA: Что рассеивается запись?

Различные демонстрации CUDA в SDK CUDA относятся к "рассеянной записи". Что это рассеивается запись и почему это является настолько большим? В отличие от какого это стоит?
вопрос задан: 18 October 2009 19:12