cuda - список вопросов по программированию cuda

1

ответ

NVIDIA NVML Несоответствие версии драйвера / библиотеки

Когда я запускаю nvidia-smi, я получаю следующее сообщение: Не удалось инициализировать NVML: Несоответствие версии драйвера / библиотеки. Час назад я получил то же сообщение и удалил свою библиотеку cuda, и я смог ...

вопрос задан: 25 March 2017 22:47

1

ответ

Максимальное количество потоков, которые могут использоваться в cuda [duplicate]

Я новичок в программировании CUDA. Мне было интересно, когда я не должен запускать максимальное количество потоков и что может ограничить мою программу от запуска максимального количества потоков, чтобы оптимизировать любой код CUDA ...

parallel-processing cuda

вопрос задан: 17 November 2016 02:56

1

ответ

Элементно векторное умножение в кубла [дубликат]

Существует ли элементное умножение в кубла? Я пытаюсь выполнить эти операции Matlab x. * S x ./ s У меня есть реализация хоста, использующая для цикла и еще один CUDA, но мне интересно, если я ...

cuda cublas elementwise-operations

вопрос задан: 2 June 2016 06:06

1

ответ

Почему индексы CUDA 2D? [Дубликат]

В CUDA (и OpenCL) индексы потоков / блоков могут быть 1D, 2D или 3D. Это просто для удобства программиста, или может ли быть фактическое преимущество при использовании, а не ...

cuda opencl nvidia

вопрос задан: 3 May 2016 13:14

1

ответ

Ошибка CudaStreamDestroy, возникающая при десериализации верхнего уровня переменной net_type [дубликат]

Проблема: я получаю ошибку CudaStreamDestroy, когда я объявляю переменную net_type в глобальной области в файле заголовка / в верхней части файла CPP. Вопрос: Как я могу создать переменную net_type ...

cuda dlib

вопрос задан: 6 March 2016 16:26

1

ответ

Потоковые мультипроцессоры, блоки и потоки (CUDA)

Какова взаимосвязь между ядром CUDA, потоковым мультипроцессором и моделью блоков и потоков CUDA? Что сопоставляется с чем и что распараллеливается и как? и что еще ...

cuda nvidia

вопрос задан: 20 February 2016 08:23

1

ответ

Конфликты в блоке памяти Общей памяти в CUDA: Как память выровненная к банкам

Насколько мое понимание идет, общая память разделена на банки, и доступы несколькими потоками к единственному элементу данных в том же банке вызовут конфликт (или широковещательно передадут). В данный момент...

optimization cuda

вопрос задан: 14 February 2016 21:31

1

ответ

пример не скомпилирован cuda 9.1 - ubuntu 16.04 LTS - с использованием поточных прерываний [дубликат]

Проблема в том, что я устанавливаю cuda 9.1 (.deb) в ubuntu 16.04 LTS, по-видимому, правильно, когда компилирую программу в cuda, она не показывает мне ошибку, но при выполнении компиляции ...

cuda

вопрос задан: 13 February 2016 09:14

1

ответ

Компилятор CUDA (nvcc) макрос

Существует ли #define компилятор (nvcc) макрос CUDA, который я могу использовать? (Как _WIN32 для Windows и так далее.) Мне нужно это для кода заголовка, который будет распространен между nvcc и VC ++ компиляторы. Я знаю, что могу пойти...

nvcc c-preprocessor macros cuda c++

вопрос задан: 27 November 2015 11:19

1

ответ

CUDA модель - что такое размер деформации?

Какова взаимосвязь между максимальным размером рабочей группы и размером деформации? Допустим, мое устройство имеет 240 потоковых процессоров CUDA (SP) и возвращает следующую информацию - CL_DEVICE_MAX_COMPUTE_UNITS: ...

cuda gpgpu

вопрос задан: 27 August 2015 18:39

1

ответ

Thrust adapting thrust :: remove_if, так что предикат проверяет существование в диапазоне [duplicate]

У меня есть два вектора, которые были застегнуты вместе. И третий вектор, который хранит подмножество уникальных значений, найденных на первом векторе в зашифрованных векторах. Я пытаюсь фильтровать zipped ...

cuda thrust

вопрос задан: 19 August 2015 03:20

1

ответ

Как ядра чередуются, когда несколько процессов CUDA работают на графическом процессоре? [Дубликат]

Мне интересно, как планировщик графических процессоров NVidia назначает вычислительные ресурсы, когда есть несколько параллельных процессов, пытающихся одновременно использовать один и тот же GPU. Предположим, что у меня есть процесс с циклом, который ..

cuda

вопрос задан: 27 July 2015 00:55

1

ответ

Неудачные распределения памяти CUDA требуют вызова cudaDeviceReset? [Дубликат]

Когда API-интерфейс API-интерфейса CUDA для выделения памяти GPU не работает, необходимо ли сбросить контекст с помощью вызова cudaDeviceReset ()?

cuda

вопрос задан: 26 July 2015 22:20

1

ответ

CUDA соединение ошибки - Visual Express 2008 - nvcc фатальный из-за (пустого) конфигурационного файла

Я искал экстенсивно возможное решение своей ошибки в течение прошлых 2 недель. Я успешно установил Cuda 64-разрядный компилятор (инструменты) и SDK, а также 64-разрядная версия Визуальных...

c++ visual-c++ cuda windows-xp linker-errors

вопрос задан: 2 March 2015 04:17

1

ответ

Скомпилируйте CUDA C / C ++ вместе с компилятором Intel (icc) на платформе Linux (Ubuntu) [дубликат]

ОС: Ubuntu Compiler: компилятор Intel и NVIDIA CUDA. Как настроить инструментальную цепочку внутри Nsight Eclipse IDE таким образом, что хост-код будет скомпилирован с использованием Intel Compiler и кода GPU ...

linux cuda icc nsight

вопрос задан: 17 April 2014 13:37

1

ответ

Я не знаю, как экспортировать матрицу из CUDA [duplicate]

У меня есть программа, которая вычисляет внутри ядра все переменные, которые мне нужно экспортировать в каждый момент времени. Однако, текущее выполнение кода включает в себя открытие, запись и закрытие .txt ...

cuda save

вопрос задан: 23 January 2014 11:07

1

ответ

Сравните Thrust fill с скоростью запуска ядра [duplicate]

Я заметил, что заполнение массива в ядре намного быстрее, чем использование thrust :: fill. Чтобы проверить это, я написал простую программу: const uint N = 1e6; __device__ uint Val2 [N]; __global__ void set0 () {...

cuda thrust

вопрос задан: 16 December 2013 17:03

1

ответ

Скопируйте Struct на хост-устройстве в CUDA [дубликат]

Я узнаю о CUDA, и я использую CUDA 9.0 с VSC 2017 с v140 (VS 2015), и у меня есть некоторые проблемы, которые я не могу решить. В моем случае у меня есть структура данных вроде этого: struct array {double * ...

cuda

вопрос задан: 16 October 2013 14:42

1

ответ

Расчеты Cuda прекращаются без каких-либо результатов [duplicate]

Я играю с CUDA и пытаюсь вычислить реалистичную модель нейрона на GPU. Это мой второй день с CUDA и, вероятно, я сделал что-то совершенно глупое. Моя система: $ nvidia-smi Wed Aug 1 18:03: ...

cuda

вопрос задан: 21 August 2013 14:17

1

ответ

С CUDA существует ли ограничение на количество вычислений или количество разрешенных блоков? [Дубликат]

Я изучаю CUDA 8.0 с Visual Studio 2015 (работает на GeForce GTX 1060). Я попытался установить 2000 блоков для запуска 1024 потоков каждый (значения, которые поддерживаются), но я получаю код ошибки 4 после ...

cuda multiprocessing gpu-programming

вопрос задан: 6 July 2013 11:07

1

ответ

Как использовать и объявлять глобальный массив device в CUDA? [Дубликат]

Я хочу объявить глобальный массив массивов во время выполнения в памяти устройства, доступный для всех функций устройства. Выполнение следующего удовлетворяет компилятору: __device__ float * g_array; Однако, ...

cuda

вопрос задан: 5 June 2013 02:07

1

ответ

Почему консоль не отображает весь вывод? [Дубликат]

Я пытаюсь генерировать простые числа, заставляя каждый поток вычислять, является ли число простым на нет. Поскольку устройство printf () имеет ограниченный буфер, есть ли способ перенаправить вывод на хост ...

cuda

вопрос задан: 15 March 2013 00:44

1

ответ

EmguCV - nvcuda.dll не может быть найден

Меня попросили создать приложение для распознавания лиц в реальном времени, и после некоторого осмотра я решил попробовать EmguCV и OpenCV в качестве библиотеки распознавания лиц. У меня проблема в ...

emgucv cuda opencv

вопрос задан: 3 March 2013 12:21

1

ответ

Вызов cuMemcpyDtoH приводит к UNKNOWN_CUDA_ERROR [дубликат]

Я пытаюсь сыграть с этим кодом, последняя часть с Python CUDA. Приведенный пример работает отлично, но когда я устанавливаю большие размеры, я получаю эту ошибку: C: \ Users \ Lichar\nextcloud \ python \ Fractal & ...

python-3.x cuda

вопрос задан: 1 November 2012 14:35

1

ответ

Сколько блоков и потоков можно использовать на графическом процессоре CUDA [duplicate]

Я получаю сообщение от confuser о настройке правильных значений для числа потоков и блоков для программирования cuda. После прочтения нескольких руководств и многих советов я не получаю ответ, который я ищу. Мой графический процессор: Nvidia ...

python vector cuda gpu numba

вопрос задан: 11 March 2012 22:24

1

ответ

Невозможно скомпилировать boost / comb с nvcc [duplicate]

Это моя программа. #include & lt; boost / range / combination.hpp & gt; #include & lt; vector & gt; #include & lt; list & gt; #include & lt; string & gt; int main () {std :: vector & lt; int & gt; a {4, 5, 6}; double b [] ...

boost cuda nvcc

вопрос задан: 15 November 2011 17:22

1

ответ

При компиляции с использованием nvcc он генерирует файлы .exp и .lib вместе с исполняемым файлом, что такое использование этих файлов? [Дубликат]

в то время как компиляторы c и c ++ генерируют только исполняемый файл, поэтому почему эти файлы генерируются nvcc на платформах linux и windows.

cuda nvcc

вопрос задан: 19 October 2011 13:33

1

ответ

неопределенная ссылка на `cudaFree 'и многие другие ошибки при компиляции программы [duplicate]

Когда я пытаюсь скомпилировать свою программу CUDA, я получаю следующие ошибки: bo: В функции `mul_wrapper ': /tmp/tmpxft_00002a64_00000000-13_b.ii:(.text+0xcb): неопределенная ссылка на` cudaConfigureCall' / tmp / .. ,

makefile compiler-errors cuda

вопрос задан: 24 August 2011 16:26

1

ответ

שגיאת NVIDIA Cuda "כל המכשירים התומכים ב- CUDA תפוסים או לא זמינים" ב- OSX

לעתים קרובות אני מקבל את ספריית CUDA להיכשל לחלוטין ולחזור עם שגיאה 46 ("כל CUDA -המכשירים היכולים להיות תפוסים או לא זמינים ") אפילו לשיחות פשוטות כמו cudaMalloc. הקוד פועל ...

cuda

вопрос задан: 14 August 2011 23:22

1

ответ

Программа Cuda не масштабируется [dублировать]

Моя программа создает 3 Матрицы, A, B и C. Затем она хранит точечный продукт A точки B в C. Я пытаюсь сравнить время, необходимое для этого на процессоре против GPU. Я написал две функции CPUDot и ...

cuda

вопрос задан: 2 August 2011 15:39