1
ответ

NVIDIA NVML Несоответствие версии драйвера / библиотеки

Когда я запускаю nvidia-smi, я получаю следующее сообщение: Не удалось инициализировать NVML: Несоответствие версии драйвера / библиотеки. Час назад я получил то же сообщение и удалил свою библиотеку cuda, и я смог ...
вопрос задан: 25 March 2017 22:47
1
ответ

Максимальное количество потоков, которые могут использоваться в cuda [duplicate]

Я новичок в программировании CUDA. Мне было интересно, когда я не должен запускать максимальное количество потоков и что может ограничить мою программу от запуска максимального количества потоков, чтобы оптимизировать любой код CUDA ...
вопрос задан: 17 November 2016 02:56
1
ответ

Элементно векторное умножение в кубла [дубликат]

Существует ли элементное умножение в кубла? Я пытаюсь выполнить эти операции Matlab x. * S x ./ s У меня есть реализация хоста, использующая для цикла и еще один CUDA, но мне интересно, если я ...
вопрос задан: 2 June 2016 06:06
1
ответ

Почему индексы CUDA 2D? [Дубликат]

В CUDA (и OpenCL) индексы потоков / блоков могут быть 1D, 2D или 3D. Это просто для удобства программиста, или может ли быть фактическое преимущество при использовании, а не ...
вопрос задан: 3 May 2016 13:14
1
ответ

Ошибка CudaStreamDestroy, возникающая при десериализации верхнего уровня переменной net_type [дубликат]

Проблема: я получаю ошибку CudaStreamDestroy, когда я объявляю переменную net_type в глобальной области в файле заголовка / в верхней части файла CPP. Вопрос: Как я могу создать переменную net_type ...
вопрос задан: 6 March 2016 16:26
1
ответ

Потоковые мультипроцессоры, блоки и потоки (CUDA)

Какова взаимосвязь между ядром CUDA, потоковым мультипроцессором и моделью блоков и потоков CUDA? Что сопоставляется с чем и что распараллеливается и как? и что еще ...
вопрос задан: 20 February 2016 08:23
1
ответ

Конфликты в блоке памяти Общей памяти в CUDA: Как память выровненная к банкам

Насколько мое понимание идет, общая память разделена на банки, и доступы несколькими потоками к единственному элементу данных в том же банке вызовут конфликт (или широковещательно передадут). В данный момент...
вопрос задан: 14 February 2016 21:31
1
ответ

пример не скомпилирован cuda 9.1 - ubuntu 16.04 LTS - с использованием поточных прерываний [дубликат]

Проблема в том, что я устанавливаю cuda 9.1 (.deb) в ubuntu 16.04 LTS, по-видимому, правильно, когда компилирую программу в cuda, она не показывает мне ошибку, но при выполнении компиляции ...
вопрос задан: 13 February 2016 09:14
1
ответ

Компилятор CUDA (nvcc) макрос

Существует ли #define компилятор (nvcc) макрос CUDA, который я могу использовать? (Как _WIN32 для Windows и так далее.) Мне нужно это для кода заголовка, который будет распространен между nvcc и VC ++ компиляторы. Я знаю, что могу пойти...
вопрос задан: 27 November 2015 11:19
1
ответ

CUDA модель - что такое размер деформации?

Какова взаимосвязь между максимальным размером рабочей группы и размером деформации? Допустим, мое устройство имеет 240 потоковых процессоров CUDA (SP) и возвращает следующую информацию - CL_DEVICE_MAX_COMPUTE_UNITS: ...
вопрос задан: 27 August 2015 18:39
1
ответ

Thrust adapting thrust :: remove_if, так что предикат проверяет существование в диапазоне [duplicate]

У меня есть два вектора, которые были застегнуты вместе. И третий вектор, который хранит подмножество уникальных значений, найденных на первом векторе в зашифрованных векторах. Я пытаюсь фильтровать zipped ...
вопрос задан: 19 August 2015 03:20
1
ответ

Как ядра чередуются, когда несколько процессов CUDA работают на графическом процессоре? [Дубликат]

Мне интересно, как планировщик графических процессоров NVidia назначает вычислительные ресурсы, когда есть несколько параллельных процессов, пытающихся одновременно использовать один и тот же GPU. Предположим, что у меня есть процесс с циклом, который ..
вопрос задан: 27 July 2015 00:55
1
ответ

Неудачные распределения памяти CUDA требуют вызова cudaDeviceReset? [Дубликат]

Когда API-интерфейс API-интерфейса CUDA для выделения памяти GPU не работает, необходимо ли сбросить контекст с помощью вызова cudaDeviceReset ()?
вопрос задан: 26 July 2015 22:20
1
ответ

CUDA соединение ошибки - Visual Express 2008 - nvcc фатальный из-за (пустого) конфигурационного файла

Я искал экстенсивно возможное решение своей ошибки в течение прошлых 2 недель. Я успешно установил Cuda 64-разрядный компилятор (инструменты) и SDK, а также 64-разрядная версия Визуальных...
вопрос задан: 2 March 2015 04:17
1
ответ

Скомпилируйте CUDA C / C ++ вместе с компилятором Intel (icc) на платформе Linux (Ubuntu) [дубликат]

ОС: Ubuntu Compiler: компилятор Intel и NVIDIA CUDA. Как настроить инструментальную цепочку внутри Nsight Eclipse IDE таким образом, что хост-код будет скомпилирован с использованием Intel Compiler и кода GPU ...
вопрос задан: 17 April 2014 13:37
1
ответ

Я не знаю, как экспортировать матрицу из CUDA [duplicate]

У меня есть программа, которая вычисляет внутри ядра все переменные, которые мне нужно экспортировать в каждый момент времени. Однако, текущее выполнение кода включает в себя открытие, запись и закрытие .txt ...
вопрос задан: 23 January 2014 11:07
1
ответ

Сравните Thrust fill с скоростью запуска ядра [duplicate]

Я заметил, что заполнение массива в ядре намного быстрее, чем использование thrust :: fill. Чтобы проверить это, я написал простую программу: const uint N = 1e6; __device__ uint Val2 [N]; __global__ void set0 () {...
вопрос задан: 16 December 2013 17:03
1
ответ

Скопируйте Struct на хост-устройстве в CUDA [дубликат]

Я узнаю о CUDA, и я использую CUDA 9.0 с VSC 2017 с v140 (VS 2015), и у меня есть некоторые проблемы, которые я не могу решить. В моем случае у меня есть структура данных вроде этого: struct array {double * ...
вопрос задан: 16 October 2013 14:42
1
ответ

Расчеты Cuda прекращаются без каких-либо результатов [duplicate]

Я играю с CUDA и пытаюсь вычислить реалистичную модель нейрона на GPU. Это мой второй день с CUDA и, вероятно, я сделал что-то совершенно глупое. Моя система: $ nvidia-smi Wed Aug 1 18:03: ...
вопрос задан: 21 August 2013 14:17
1
ответ

С CUDA существует ли ограничение на количество вычислений или количество разрешенных блоков? [Дубликат]

Я изучаю CUDA 8.0 с Visual Studio 2015 (работает на GeForce GTX 1060). Я попытался установить 2000 блоков для запуска 1024 потоков каждый (значения, которые поддерживаются), но я получаю код ошибки 4 после ...
вопрос задан: 6 July 2013 11:07
1
ответ

Как использовать и объявлять глобальный массив __device__ в CUDA? [Дубликат]

Я хочу объявить глобальный массив массивов во время выполнения в памяти устройства, доступный для всех функций устройства. Выполнение следующего удовлетворяет компилятору: __device__ float * g_array; Однако, ...
вопрос задан: 5 June 2013 02:07
1
ответ

Почему консоль не отображает весь вывод? [Дубликат]

Я пытаюсь генерировать простые числа, заставляя каждый поток вычислять, является ли число простым на нет. Поскольку устройство printf () имеет ограниченный буфер, есть ли способ перенаправить вывод на хост ...
вопрос задан: 15 March 2013 00:44
1
ответ

EmguCV - nvcuda.dll не может быть найден

Меня попросили создать приложение для распознавания лиц в реальном времени, и после некоторого осмотра я решил попробовать EmguCV и OpenCV в качестве библиотеки распознавания лиц. У меня проблема в ...
вопрос задан: 3 March 2013 12:21
1
ответ

Вызов cuMemcpyDtoH приводит к UNKNOWN_CUDA_ERROR [дубликат]

Я пытаюсь сыграть с этим кодом, последняя часть с Python CUDA. Приведенный пример работает отлично, но когда я устанавливаю большие размеры, я получаю эту ошибку: C: \ Users \ Lichar\nextcloud \ python \ Fractal & ...
вопрос задан: 1 November 2012 14:35
1
ответ

Сколько блоков и потоков можно использовать на графическом процессоре CUDA [duplicate]

Я получаю сообщение от confuser о настройке правильных значений для числа потоков и блоков для программирования cuda. После прочтения нескольких руководств и многих советов я не получаю ответ, который я ищу. Мой графический процессор: Nvidia ...
вопрос задан: 11 March 2012 22:24
1
ответ

Невозможно скомпилировать boost / comb с nvcc [duplicate]

Это моя программа. #include & lt; boost / range / combination.hpp & gt; #include & lt; vector & gt; #include & lt; list & gt; #include & lt; string & gt; int main () {std :: vector & lt; int & gt; a {4, 5, 6}; double b [] ...
вопрос задан: 15 November 2011 17:22
1
ответ

При компиляции с использованием nvcc он генерирует файлы .exp и .lib вместе с исполняемым файлом, что такое использование этих файлов? [Дубликат]

в то время как компиляторы c и c ++ генерируют только исполняемый файл, поэтому почему эти файлы генерируются nvcc на платформах linux и windows.
вопрос задан: 19 October 2011 13:33
1
ответ

неопределенная ссылка на `cudaFree 'и многие другие ошибки при компиляции программы [duplicate]

Когда я пытаюсь скомпилировать свою программу CUDA, я получаю следующие ошибки: bo: В функции `mul_wrapper ': /tmp/tmpxft_00002a64_00000000-13_b.ii:(.text+0xcb): неопределенная ссылка на` cudaConfigureCall' / tmp / .. ,
вопрос задан: 24 August 2011 16:26
1
ответ

שגיאת NVIDIA Cuda "כל המכשירים התומכים ב- CUDA תפוסים או לא זמינים" ב- OSX

לעתים קרובות אני מקבל את ספריית CUDA להיכשל לחלוטין ולחזור עם שגיאה 46 ("כל CUDA -המכשירים היכולים להיות תפוסים או לא זמינים ") אפילו לשיחות פשוטות כמו cudaMalloc. הקוד פועל ...
вопрос задан: 14 August 2011 23:22
1
ответ

Программа Cuda не масштабируется [dублировать]

Моя программа создает 3 Матрицы, A, B и C. Затем она хранит точечный продукт A точки B в C. Я пытаюсь сравнить время, необходимое для этого на процессоре против GPU. Я написал две функции CPUDot и ...
вопрос задан: 2 August 2011 15:39