Я пытаюсь разбить и изменить структуру массива асинхронно, используя ядро CUDA. memcpy ()не работает внутри ядра, как и cudaMemcpy ()*; Я в растерянности. Может...
когда действительно необходим вызов функции cudaDeviceSynchronize?. Насколько я понял из документации CUDA, ядра CUDA асинхронны, поэтому кажется, что нам следует вызывать...
Как следует из следующей ошибки, вызов функции хоста ('rand') в ядре недопустим, и мне интересно, есть ли решение для этого, если мне нужно это сделать. ошибка: вызов функции хоста ("...
У меня есть 2 очень похожие функции ядра в том смысле, что код почти такой же, но с небольшой разницей. В настоящее время у меня есть 2 варианта: Написать 2 разных метода (но очень похожих) ...
If you have work items executing in a wavefront and there is a conditional such as: if(x){ ... } else{ .... } What do the work-items execute? is it the case whereby all ...
Теоретически у вас может быть 65535 блоков на размер сетки, вплоть до 65535 * 65535 * 65535. Мой вопрос: если вы называете такое ядро, как это ядро<<< BLOCKS,THREADS >>>() (...
Если абсолютно необходимо, чтобы все потоки в блоке находились в одной и той же точке кода , нужна ли нам функция __syncthreads, если количество запускаемых потоков равно ...
В качестве заголовка я хотел бы знать правильный порядок выполнения, если у нас есть 3d-блок, я думаю, чтобы помнить, что я уже кое-что читал об этом, но это было некоторое время назад, я не помню где, но...
Я все еще злюсь на эти матрицы неизвестного размера, которые могут варьироваться от 10-20,000 для каждого измерения. Я смотрю на CUDA sdk и задаюсь вопросом: что, если я выберу слишком большое количество блоков? ...
мне действительно нужна помощь и совет, так как я новичок в обработке изображений в реальном времени. Я пытаюсь реализовать алгоритм для системы, в которой камера получает 1000 кадров в секунду, и мне нужно получить значение каждого пикселя...
Может ли кто-нибудь помочь мне с очень простым примером использования разделяемой памяти? Пример, включенный в руководство по программированию Cuda C, кажется загроможденным несущественными деталями. Например, если я скопирую ...
У меня была простая проблема CUDA для назначения класса, но профессор добавил дополнительную задачу для реализации тот же алгоритм с использованием вместо этого разделяемой памяти. Я не смог закончить его до крайнего срока ...
Что такое сокращение от "SASS"? Я знаю, что это нативный код asembly уровня ISA, ориентированный на конкретное оборудование,
выходит между кодом PTX и двоичным кодом.
но любой может любезно сказать мне, что делает каждый...
Я работаю над программой с ускорением на графическом процессоре, которая требует чтения всего файла переменного размера. Мой вопрос, каково оптимальное количество байтов для чтения из файла и передачи в ...
Как я могу использовать два устройства, чтобы улучшить, например, производительность следующего кода (сумма векторов)?
Можно ли использовать больше устройств «одновременно»?
Если да, то как я могу управлять ...
Я хочу измерить время внутреннего ядра графического процессора, как его измерить в NVIDIA CUDA?
например __global__ void kernelSample()
{ здесь какой-то код получить время начала какой-то код здесь получить время остановки какой-то ...
Когда я запускаю свою программу CUDA, которая выделяет лишь небольшой объем глобальной памяти (менее 20 М), я получаю ошибку "out of memory". (Судя по сообщениям других людей, я думаю, что проблема связана с памятью ...
Я подключаюсь к своему рабочему столу с картой Nvidia (совместимой с CUDA) с помощью подключения к удаленному рабочему столу. Я делаю это, потому что сейчас у меня нет монитора! Поэтому я временно использую свой ...
Я использую CUBLAS (библиотеки Cuda Blas) для матричных операций. Можно ли использовать CUBLAS для достижения возведения в степень / среднеквадратичного значения элементов матрицы? Я имею в виду, имея матрицу 2x2 1 4
9 16 ...
Я разрабатываю приложение CUDA 4.0, работающее на карте Fermi. Согласно спецификациям, Fermi имеет Compute Capability 2.0 и, следовательно, должен поддерживать не встроенные вызовы функций. Я компилирую каждый класс ...
Я начинаю программировать на CUDA, и в некоторых примерах я нахожу включаемые файлы cuda.h, cuda_runtime.h и cuda_runtime_api.h, включенные в код. Может кто-нибудь объяснить мне разницу между ...
У меня проблемы с компиляцией некоторых примеров поставляется с CUDA SDK.
Я установил драйвер разработчика (версия 270.41.19) и инструментарий CUDA,
затем, наконец, SDK (обе версии 4.0.17). ...
Я пытаюсь вызвать Функция CUDA (хост) из файла C ++, скомпилированного отдельно: sample.cpp Файл C ++: extern "C" void cuda_function (int a, int b);
int main () {// операторы cuda_function (23, 34);
...
Есть ли способ вызвать вызовы функций времени выполнения CUDA, такие как cudaMemcpy (...) ; в файле .cpp, скомпилированном с помощью обычного компилятора C ++?
У меня путаница из руководства по программированию. В нем говорится следующее:
maxThreadsDim: 512, 512, 64. Когда максимальное количество потоков в блоке может быть 512, как может максимальное ...
Мне нужна помощь, чтобы начать работу с проектом с использованием CUDA. Моя цель - создать проект, который я могу скомпилировать в собственном компиляторе g ++, но использует код CUDA. Я понимаю, что мне нужно скомпилировать ...
Я хочу использовать код сборки в коде CUDA C
чтобы сократить дорогостоящие казни
как мы это делаем, используя asm в программировании на C. Возможно ли это?
Я пытаюсь реализовать умножение матрицы на вектор на GPU (с использованием CUDA). В моем коде C ++ (CPU) я загружаю матрицу как плотную матрицу, а затем выполняю умножение матрицы на вектор с помощью CUDA ....
Я работаю над изображением обработка с помощью CUDA, и я сомневаюсь в обработке пикселей. Что часто происходит с граничными пикселями изображения при применении фильтра свертки amxm? В 3 x 3 ...