cuda - список вопросов по программированию cuda

0

ответов

Существует ли аналог memcpy (), работающий внутри ядра CUDA?

Я пытаюсь разбить и изменить структуру массива асинхронно, используя ядро CUDA. memcpy ()не работает внутри ядра, как и cudaMemcpy ()*; Я в растерянности. Может...

cuda

вопрос задан: 12 June 2016 10:19

0

ответов

Когда вызывать cudaDeviceSynchronize?

когда действительно необходим вызов функции cudaDeviceSynchronize?. Насколько я понял из документации CUDA, ядра CUDA асинхронны, поэтому кажется, что нам следует вызывать...

cuda gpu gpgpu

вопрос задан: 16 May 2016 10:15

0

ответов

Как вызвать функцию хоста в ядре CUDA?

Как следует из следующей ошибки, вызов функции хоста ('rand') в ядре недопустим, и мне интересно, есть ли решение для этого, если мне нужно это сделать. ошибка: вызов функции хоста ("...

gpgpu cuda

вопрос задан: 10 May 2016 10:09

0

ответов

Должен ли я объединить два похожих ядра с помощью оператора if, что может привести к потере производительности?

У меня есть 2 очень похожие функции ядра в том смысле, что код почти такой же, но с небольшой разницей. В настоящее время у меня есть 2 варианта: Написать 2 разных метода (но очень похожих) ...

c++ c optimization cuda gpgpu

вопрос задан: 15 April 2016 22:24

0

ответов

What do work items execute when conditionals are used in GPU programming?

If you have work items executing in a wavefront and there is a conditional such as: if(x){ ... } else{ .... } What do the work-items execute? is it the case whereby all ...

cuda opencl gpu gpgpu gpu-programming

вопрос задан: 30 March 2016 22:21

0

ответов

Каково максимально возможное количество блоков в CUDA?

Теоретически у вас может быть 65535 блоков на размер сетки, вплоть до 65535 * 65535 * 65535. Мой вопрос: если вы называете такое ядро, как это ядро<<< BLOCKS,THREADS >>>() (...

cuda

вопрос задан: 7 March 2016 18:46

0

ответов

Сколько «ядер CUDA» имеет каждый мультипроцессор графического процессора?

Я знаю, что в устройствах до архитектуры Fermi было 8 SP в одном мультипроцессоре. Такое же количество в архитектуре Ферми?

cuda gpu gpgpu

вопрос задан: 2 March 2016 17:01

0

ответов

Использование CUDA __syncthreads() в варпе

Если абсолютно необходимо, чтобы все потоки в блоке находились в одной и той же точке кода , нужна ли нам функция __syncthreads, если количество запускаемых потоков равно ...

cuda parallel-processing synchronization

вопрос задан: 27 February 2016 13:56

0

ответов

Cuda, порядок выполнения потоков в 3d -блоке

В качестве заголовка я хотел бы знать правильный порядок выполнения, если у нас есть 3d-блок, я думаю, чтобы помнить, что я уже кое-что читал об этом, но это было некоторое время назад, я не помню где, но...

cuda

вопрос задан: 27 February 2016 13:56

0

ответов

CUDA - что, если я выберу слишком много блоков?

Я все еще злюсь на эти матрицы неизвестного размера, которые могут варьироваться от 10-20,000 для каждого измерения. Я смотрю на CUDA sdk и задаюсь вопросом: что, если я выберу слишком большое количество блоков? ...

c++ matrix cuda

вопрос задан: 20 February 2016 10:29

0

ответов

Советы по обработке изображений в реальном времени

мне действительно нужна помощь и совет, так как я новичок в обработке изображений в реальном времени. Я пытаюсь реализовать алгоритм для системы, в которой камера получает 1000 кадров в секунду, и мне нужно получить значение каждого пикселя...

cuda image-processing opencv opencl

вопрос задан: 20 February 2016 09:04

0

ответов

Когда полезна память CUDA shared?

Может ли кто-нибудь помочь мне с очень простым примером использования разделяемой памяти? Пример, включенный в руководство по программированию Cuda C, кажется загроможденным несущественными деталями. Например, если я скопирую ...

c cuda gpu

вопрос задан: 14 February 2016 21:42

0

ответов

CUDA: Общая память над большим 2D-массивом

У меня была простая проблема CUDA для назначения класса, но профессор добавил дополнительную задачу для реализации тот же алгоритм с использованием вместо этого разделяемой памяти. Я не смог закончить его до крайнего срока ...

cuda

вопрос задан: 14 February 2016 21:39

0

ответов

Что такое сокращение от "SASS"? [закрыто]

Что такое сокращение от "SASS"? Я знаю, что это нативный код asembly уровня ISA, ориентированный на конкретное оборудование, выходит между кодом PTX и двоичным кодом. но любой может любезно сказать мне, что делает каждый...

cuda

вопрос задан: 13 February 2016 07:28

0

ответов

Эффективно передать большой файл (до 2 ГБ) на GPU CUDA?

Я работаю над программой с ускорением на графическом процессоре, которая требует чтения всего файла переменного размера. Мой вопрос, каково оптимальное количество байтов для чтения из файла и передачи в ...

bandwidth cuda file-transfer io large-files

вопрос задан: 21 January 2016 14:51

0

ответов

Основное использование нескольких графических процессоров

Как я могу использовать два устройства, чтобы улучшить, например, производительность следующего кода (сумма векторов)? Можно ли использовать больше устройств «одновременно»? Если да, то как я могу управлять ...

cuda gpu multi-gpu

вопрос задан: 15 January 2016 14:34

0

ответов

Как измерить внутреннее время ядра в NVIDIA CUDA?

Я хочу измерить время внутреннего ядра графического процессора, как его измерить в NVIDIA CUDA? например __global__ void kernelSample() { здесь какой-то код получить время начала какой-то код здесь получить время остановки какой-то ...

cuda gpu gpgpu nvidia

вопрос задан: 15 January 2016 10:15

0

ответов

Как управляется память CUDA?

Когда я запускаю свою программу CUDA, которая выделяет лишь небольшой объем глобальной памяти (менее 20 М), я получаю ошибку "out of memory". (Судя по сообщениям других людей, я думаю, что проблема связана с памятью ...

cuda nvidia gpu-programming

вопрос задан: 15 January 2016 06:05

0

ответов

Как запустить код cuda с помощью удаленного рабочего стола?

Я подключаюсь к своему рабочему столу с картой Nvidia (совместимой с CUDA) с помощью подключения к удаленному рабочему столу. Я делаю это, потому что сейчас у меня нет монитора! Поэтому я временно использую свой ...

c++ c cuda

вопрос задан: 9 January 2016 00:38

0

ответов

CUBLAS - возможно ли возведение в степень матричных элементов?

Я использую CUBLAS (библиотеки Cuda Blas) для матричных операций. Можно ли использовать CUBLAS для достижения возведения в степень / среднеквадратичного значения элементов матрицы? Я имею в виду, имея матрицу 2x2 1 4 9 16 ...

matrix cuda cublas

вопрос задан: 1 January 2016 17:21

0

ответов

CUDA Внешние вызовы не поддерживаются

Я разрабатываю приложение CUDA 4.0, работающее на карте Fermi. Согласно спецификациям, Fermi имеет Compute Capability 2.0 и, следовательно, должен поддерживать не встроенные вызовы функций. Я компилирую каждый класс ...

cuda

вопрос задан: 8 December 2015 16:40

0

ответов

Разница между cuda.h, cuda_runtime.h, cuda_runtime_api.h

Я начинаю программировать на CUDA, и в некоторых примерах я нахожу включаемые файлы cuda.h, cuda_runtime.h и cuda_runtime_api.h, включенные в код. Может кто-нибудь объяснить мне разницу между ...

cuda header-files

вопрос задан: 4 December 2015 13:47

0

ответов

CUDA несовместима с моей версией gcc

У меня проблемы с компиляцией некоторых примеров поставляется с CUDA SDK. Я установил драйвер разработчика (версия 270.41.19) и инструментарий CUDA, затем, наконец, SDK (обе версии 4.0.17). ...

cuda gcc debian

вопрос задан: 2 December 2015 04:48

0

ответов

Вызов кода CUDA из обычного кода C ++ - сортировка внешнего «C»

Я пытаюсь вызвать Функция CUDA (хост) из файла C ++, скомпилированного отдельно: sample.cpp Файл C ++: extern "C" void cuda_function (int a, int b); int main () {// операторы cuda_function (23, 34); ...

c++ cuda integration compatibility

вопрос задан: 26 November 2015 23:06

0

ответов

Могу ли я вызвать функцию времени выполнения CUDA из кода C ++, не скомпилированного nvcc?

Есть ли способ вызвать вызовы функций времени выполнения CUDA, такие как cudaMemcpy (...) ; в файле .cpp, скомпилированном с помощью обычного компилятора C ++?

c++ cuda compatibility

вопрос задан: 26 November 2015 22:55

0

ответов

Максимальное количество потоков CUDA в блоке

У меня путаница из руководства по программированию. В нем говорится следующее: maxThreadsDim: 512, 512, 64. Когда максимальное количество потоков в блоке может быть 512, как может максимальное ...

cuda

вопрос задан: 13 November 2015 13:11

0

ответов

Как я могу скомпилировать код CUDA, а затем связать его с проектом C ++?

Мне нужна помощь, чтобы начать работу с проектом с использованием CUDA. Моя цель - создать проект, который я могу скомпилировать в собственном компиляторе g ++, но использует код CUDA. Я понимаю, что мне нужно скомпилировать ...

cuda g++ nvcc

вопрос задан: 10 November 2015 00:57

0

ответов

Можно ли поместить инструкции по сборке в код CUDA?

Я хочу использовать код сборки в коде CUDA C чтобы сократить дорогостоящие казни как мы это делаем, используя asm в программировании на C. Возможно ли это?

c assembly cuda inline-assembly ptx

вопрос задан: 5 November 2015 16:14

0

ответов

Разреженное умножение матрицы на вектор в CUDA

Я пытаюсь реализовать умножение матрицы на вектор на GPU (с использованием CUDA). В моем коде C ++ (CPU) я загружаю матрицу как плотную матрицу, а затем выполняю умножение матрицы на вектор с помощью CUDA ....

c++ cuda sparse-matrix matrix-multiplication

вопрос задан: 26 October 2015 22:47

0

ответов

Работа с граничными условиями / областями Halo в CUDA

Я работаю над изображением обработка с помощью CUDA, и я сомневаюсь в обработке пикселей. Что часто происходит с граничными пикселями изображения при применении фильтра свертки amxm? В 3 x 3 ...

image-processing cuda convolution

вопрос задан: 2 September 2015 08:53