1
ответ

Существуют ли ограничения на длину массива ядра CUDA? [Дубликат]

Я хотел бы сгенерировать массив целых чисел с использованием GPU. Я нашел некоторые решения в документации NVIDIA и на основе этого написал простой код ниже. Когда я запускаю его, он работает хорошо, но только если ...
вопрос задан: 2 August 2011 15:39
1
ответ

Numba \ CUDA * .copy_to_host [дубликат]

Я пытаюсь реализовать операцию простого умножения с помощью cuda\numba. Я встречаюсь с необычной проблемой в Numba, и я надеюсь, что вы можете мне помочь. Это строка кода, который я использую: ...
вопрос задан: 2 August 2011 15:39
1
ответ

cudaErrorLaunchFailure при запуске MD5 5000 раз [дубликат]

У меня есть код CUDA, например: __global__ void test () {для (unsigned int loop = 1; loop & lt; MAX_LOOP; loop ++) {unsigned char hash [32]; MD5Ctx ctx; md5_init (& амп; CTX); ...
вопрос задан: 2 August 2011 15:39
1
ответ

Ограничение инструкции Cuda [дубликат]

Есть ли ограничение на то, сколько команд может быть выполнено в потоке cuda? Например, если я запустил этот код ниже, набрав около 10 миллионов итераций пустого цикла, он никогда не достигнет последнего ...
вопрос задан: 2 August 2011 15:39
1
ответ

CUDA / OpenCL в виртуальной машине / гипервизоре [закрыто]

Всем известны какие-либо решения виртуализации, которые либо разрешают доступ CUDA / OpenCL напрямую, либо реализуют абстракцию CUDA / OpenCL. ОБНОВЛЕНИЕ: Спасибо тем, кто прокомментировал. Хотя классический «рабочий стол» ...
вопрос задан: 30 March 2011 16:57
1
ответ

Есть ли сборка - в векторных и скалярных произведениях в CUDA?

Есть ли сборка - в векторных и скалярных произведениях в CUDA как в opencl, таким образом, cuda ядра могут использовать его? Мне ничего не нашли в спецификации до сих пор.
вопрос задан: 7 July 2010 16:23
1
ответ

Атомарные операции на глобальной памяти в CUDA выполнены параллельно через деформацию?

Я должен сделать, атомарный FP добавляет операцию на глобальной памяти на устройстве CC 2.0. Если глобальные данные, на которые ссылаются в деформации, вписываются в выровненный 128-байтовый сектор, будут эти операции делаться параллельно или...
вопрос задан: 30 June 2010 10:30
1
ответ

Портирование проекта к OpenGL3

Я работаю над C++ межплатформенное приложение OpenGL (Windows, Linux и MacOS), и я задаюсь вопросом, могли ли некоторые из Вас совместно использовать некоторые советы относительно портирования крупного приложения к OpenGL 3. Причина я...
вопрос задан: 3 June 2010 14:29
1
ответ

Nvidia Tesla по сравнению с 480 для [закрытого] программирования CUDA

Я провожу исследование в области программирования CUDA. у меня есть опция купить единственную Nvidia Tesla или купить вокруг 4-5 NVidia 480?что Вы порекомендуете?
вопрос задан: 9 May 2010 19:47
1
ответ

Как структурировать данные для оптимальной скорости в приложении CUDA

Я пытаюсь записать простую систему частиц, которая усиливает CUDA, чтобы сделать обновление положений частицы. Прямо сейчас я определяю частицу, имеет объект с положением, определенным с три...
вопрос задан: 1 February 2010 19:28
1
ответ

Как идентификаторы устройства NVAPI касаются идентификаторов устройства CUDA?

Я работаю над тем, чтобы заставлять приложение CUDA также контролировать внутреннюю температуру GPU. Та информация доступна через NVAPI. Проблема состоит в том, что я хочу удостовериться, что я контролирую тот же GPU, как я...
вопрос задан: 29 January 2010 07:59
1
ответ

Используя утверждают в рамках вызова ядра

Есть ли удобный способ для использования, утверждает в рамках вызова ядер на режиме устройства?Заранее спасибо.
вопрос задан: 17 January 2010 08:03
1
ответ

Неразрешенные внешние ссылки в новичках программа CUDA

Я создаю новое Консольное Приложение Win32 как пустой проект, я запускаю Windows 7 64bit с C++ Visual Studio 2008 года. Я пытаюсь заставить пример кода от нижней части этой статьи создавать: http://www....
вопрос задан: 14 January 2010 01:58
0
ответов

128-битное целое число на cuda?

Мне только что удалось установить мой cuda SDK под Linux Ubuntu 10.04. Моя графическая карта - NVIDIA geForce GT 425M, и я хотел бы использовать ее для решения некоторых серьезных вычислительных задач. Интересно, а есть ли ...
вопрос задан: 10 October 2019 16:30
0
ответов

Настройка Visual Studio Intellisense для вызовов ядра CUDA

Я только начал программировать CUDA, и все идет довольно хорошо, мой GPU распознаются и все. Я частично настроил Intellisense в Visual Studio, используя это чрезвычайно полезное руководство здесь: ...
вопрос задан: 10 August 2019 11:18
0
ответов

Подсчет количества вхождений чисел в массиве CUDA

У меня есть массив целых чисел без знака, хранящийся на графическом процессоре с помощью CUDA (обычно 1000000 элементов). Я хотел бы подсчитать появление каждого числа в массиве. Есть только несколько различных чисел (...
вопрос задан: 10 July 2019 12:05
0
ответов

Предлагает ли AMD OpenCL что-то похожее на GPUDirect CUDA?

NVIDIA предлагает GPUDirect для уменьшения накладных расходов на передачу памяти. Интересно, есть ли аналогичная концепция для AMD / ATI? В частности: 1) Избегают ли графические процессоры AMD второй передачи памяти при взаимодействии ...
вопрос задан: 22 June 2019 18:12
0
ответов

hemi :: Массив в hemi ::rallel_for для неверного индекса

Я новичок в CUDA, и я пытаюсь понять некоторые основные операции, такие как присвоение значений массиву в parallel_for, используя массив 1d в качестве матрицы, я пытаюсь назначить максимальные значения и минимальные значения двух ...
вопрос задан: 27 March 2019 13:36
0
ответов

Как исправить потоки на блок в графическом процессоре?

Я новичок в кодировании GPU с использованием CUDA. Я попробовал простой пример (как прикрепленный код) об использовании графического процессора. Когда я извлек 6 переменных с одинаковым значением, они отображались с другими результатами (например, 0 64832
вопрос задан: 26 March 2019 00:57
0
ответов

Множественное определение функций устройства CUDA

Я пытаюсь скомпилировать некоторые функции, чтобы использовать их в коде хоста и коде устройства, но я получаю ошибку связывания с несколькими определениями. Я пытаюсь добиться следующего: у меня есть ...
вопрос задан: 20 March 2019 11:14
0
ответов

Смешайте пользовательское управление памятью и Thrust в CUDA

В моем проекте я реализовал специальный распределитель памяти, чтобы избежать ненужных вызовов cudaMalloc после того, как приложение «разогреется». Более того, я использую собственные ядра для базового заполнения массива, ...
вопрос задан: 30 January 2019 04:10
0
ответов

Почему PyTorch не находит мои драйверы NVIDIA для поддержки CUDA?

Я добавил GeForce GTX 1080 Ti на свою машину (с Ubuntu 18.04 и Anaconda с Python 3.7), чтобы использовать GPU при использовании PyTorch. Обе карты правильно определены: $ lspci | grep VGA 03: ...
вопрос задан: 19 January 2019 05:30
0
ответов

Why is MATLAB so fast in matrix multiplication?

I am making some benchmarks with CUDA, C++, C#, and Java, and using MATLAB for verification and matrix generation. But when I multiply with MATLAB, 2048x2048 and even bigger matrices are almost ...
вопрос задан: 16 January 2019 21:25
0
ответов

Ошибка сегментации после второго cudaMalloc

Я получаю ошибку сегментации после второго cudaMalloc. #include < cuda.h > #include < cuda_runtime.h > int main () {int n = 16; float2 * a; cudaMalloc ((void **) a, n * sizeof (float2)); ...
вопрос задан: 16 January 2019 12:24
0
ответов

Как получить спецификации карты программно в CUDA

Я только начинаю работать с CUDA. Есть ли способ получить спецификации карты программно?
вопрос задан: 4 January 2019 04:12
0
ответов

Различные версии CUDA, представленные nvcc и NVIDIA-smi

Я очень смущен различными версиями CUDA, показанными при запуске nvcc и nvidia-smi. На моем Ubuntu 16.04 установлены как cuda9.2, так и cuda10. Теперь я установил PATH так, чтобы он указывал на cuda9.2. Так ...
вопрос задан: 22 November 2018 00:56
0
ответов

Как получить версию cuda?

Есть ли какая-нибудь быстрая команда или скрипт для проверки установленной версии CUDA? Я нашел руководство по версии 4.0 в каталоге установки, но не уверен, что оно действительно установлено...
вопрос задан: 16 November 2018 13:10
0
ответов

CUDA __threadfence ()

Я просмотрел много сообщений на форуме и документацию NVIDIA, но не смог t понять, что делает __threadfence () и как его использовать. Может кто-нибудь объяснить, какова цель этой встроенной функции?
вопрос задан: 21 August 2018 10:03
0
ответов

Компиляция CUDA без Visual Studio - "Cannot find compiler cl.exe in path"

Я только что начал небольшой проект на CUDA. Мне нужно знать следующее: Возможно ли скомпилировать код CUDA без использования/покупки Microsoft Visual Studio? При использовании Nvcc.exe я получаю ошибку "Cannot find ...
вопрос задан: 18 July 2018 03:50
0
ответов

Файлы внешнего источника и заголовка в C ++ CUDA

Я довольно часто разбиваю определения и реализации на внешние файлы на C ++, так как это помогает мне поддерживать чистый, читаемый код. Однако в последнее время я начал использовать CUDA, в котором я не могу это сделать ...
вопрос задан: 13 July 2018 22:34