0
ответов

Существует ли аналог memcpy (), работающий внутри ядра CUDA?

Я пытаюсь разбить и изменить структуру массива асинхронно, используя ядро ​​CUDA. memcpy ()не работает внутри ядра, как и cudaMemcpy ()*; Я в растерянности. Может...
вопрос задан: 12 June 2016 10:19
0
ответов

Когда вызывать cudaDeviceSynchronize?

когда действительно необходим вызов функции cudaDeviceSynchronize?. Насколько я понял из документации CUDA, ядра CUDA асинхронны, поэтому кажется, что нам следует вызывать...
вопрос задан: 16 May 2016 10:15
0
ответов

Как вызвать функцию хоста в ядре CUDA?

Как следует из следующей ошибки, вызов функции хоста ('rand') в ядре недопустим, и мне интересно, есть ли решение для этого, если мне нужно это сделать. ошибка: вызов функции хоста ("...
вопрос задан: 10 May 2016 10:09
0
ответов

Должен ли я объединить два похожих ядра с помощью оператора if, что может привести к потере производительности?

У меня есть 2 очень похожие функции ядра в том смысле, что код почти такой же, но с небольшой разницей. В настоящее время у меня есть 2 варианта: Написать 2 разных метода (но очень похожих) ...
вопрос задан: 15 April 2016 22:24
0
ответов

What do work items execute when conditionals are used in GPU programming?

If you have work items executing in a wavefront and there is a conditional such as: if(x){ ... } else{ .... } What do the work-items execute? is it the case whereby all ...
вопрос задан: 30 March 2016 22:21
0
ответов

Каково максимально возможное количество блоков в CUDA?

Теоретически у вас может быть 65535 блоков на размер сетки, вплоть до 65535 * 65535 * 65535. Мой вопрос: если вы называете такое ядро, как это ядро<<< BLOCKS,THREADS >>>() (...
вопрос задан: 7 March 2016 18:46
0
ответов

Сколько «ядер CUDA» имеет каждый мультипроцессор графического процессора?

Я знаю, что в устройствах до архитектуры Fermi было 8 SP в одном мультипроцессоре. Такое же количество в архитектуре Ферми?
вопрос задан: 2 March 2016 17:01
0
ответов

Использование CUDA __syncthreads() в варпе

Если абсолютно необходимо, чтобы все потоки в блоке находились в одной и той же точке кода , нужна ли нам функция __syncthreads, если количество запускаемых потоков равно ...
вопрос задан: 27 February 2016 13:56
0
ответов

Cuda, порядок выполнения потоков в 3d -блоке

В качестве заголовка я хотел бы знать правильный порядок выполнения, если у нас есть 3d-блок, я думаю, чтобы помнить, что я уже кое-что читал об этом, но это было некоторое время назад, я не помню где, но...
вопрос задан: 27 February 2016 13:56
0
ответов

CUDA - что, если я выберу слишком много блоков?

Я все еще злюсь на эти матрицы неизвестного размера, которые могут варьироваться от 10-20,000 для каждого измерения. Я смотрю на CUDA sdk и задаюсь вопросом: что, если я выберу слишком большое количество блоков? ...
вопрос задан: 20 February 2016 10:29
0
ответов

Советы по обработке изображений в реальном времени

мне действительно нужна помощь и совет, так как я новичок в обработке изображений в реальном времени. Я пытаюсь реализовать алгоритм для системы, в которой камера получает 1000 кадров в секунду, и мне нужно получить значение каждого пикселя...
вопрос задан: 20 February 2016 09:04
0
ответов

Когда полезна память CUDA __shared__?

Может ли кто-нибудь помочь мне с очень простым примером использования разделяемой памяти? Пример, включенный в руководство по программированию Cuda C, кажется загроможденным несущественными деталями. Например, если я скопирую ...
вопрос задан: 14 February 2016 21:42
0
ответов

CUDA: Общая память над большим 2D-массивом

У меня была простая проблема CUDA для назначения класса, но профессор добавил дополнительную задачу для реализации тот же алгоритм с использованием вместо этого разделяемой памяти. Я не смог закончить его до крайнего срока ...
вопрос задан: 14 February 2016 21:39
0
ответов

Что такое сокращение от "SASS"? [закрыто]

Что такое сокращение от "SASS"? Я знаю, что это нативный код asembly уровня ISA, ориентированный на конкретное оборудование, выходит между кодом PTX и двоичным кодом. но любой может любезно сказать мне, что делает каждый...
вопрос задан: 13 February 2016 07:28
0
ответов

Эффективно передать большой файл (до 2 ГБ) на GPU CUDA?

Я работаю над программой с ускорением на графическом процессоре, которая требует чтения всего файла переменного размера. Мой вопрос, каково оптимальное количество байтов для чтения из файла и передачи в ...
вопрос задан: 21 January 2016 14:51
0
ответов

Основное использование нескольких графических процессоров

Как я могу использовать два устройства, чтобы улучшить, например, производительность следующего кода (сумма векторов)? Можно ли использовать больше устройств «одновременно»? Если да, то как я могу управлять ...
вопрос задан: 15 January 2016 14:34
0
ответов

Как измерить внутреннее время ядра в NVIDIA CUDA?

Я хочу измерить время внутреннего ядра графического процессора, как его измерить в NVIDIA CUDA? например __global__ void kernelSample() { здесь какой-то код получить время начала какой-то код здесь получить время остановки какой-то ...
вопрос задан: 15 January 2016 10:15
0
ответов

Как управляется память CUDA?

Когда я запускаю свою программу CUDA, которая выделяет лишь небольшой объем глобальной памяти (менее 20 М), я получаю ошибку "out of memory". (Судя по сообщениям других людей, я думаю, что проблема связана с памятью ...
вопрос задан: 15 January 2016 06:05
0
ответов

Как запустить код cuda с помощью удаленного рабочего стола?

Я подключаюсь к своему рабочему столу с картой Nvidia (совместимой с CUDA) с помощью подключения к удаленному рабочему столу. Я делаю это, потому что сейчас у меня нет монитора! Поэтому я временно использую свой ...
вопрос задан: 9 January 2016 00:38
0
ответов

CUBLAS - возможно ли возведение в степень матричных элементов?

Я использую CUBLAS (библиотеки Cuda Blas) для матричных операций. Можно ли использовать CUBLAS для достижения возведения в степень / среднеквадратичного значения элементов матрицы? Я имею в виду, имея матрицу 2x2 1 4 9 16 ...
вопрос задан: 1 January 2016 17:21
0
ответов

CUDA Внешние вызовы не поддерживаются

Я разрабатываю приложение CUDA 4.0, работающее на карте Fermi. Согласно спецификациям, Fermi имеет Compute Capability 2.0 и, следовательно, должен поддерживать не встроенные вызовы функций. Я компилирую каждый класс ...
вопрос задан: 8 December 2015 16:40
0
ответов

Разница между cuda.h, cuda_runtime.h, cuda_runtime_api.h

Я начинаю программировать на CUDA, и в некоторых примерах я нахожу включаемые файлы cuda.h, cuda_runtime.h и cuda_runtime_api.h, включенные в код. Может кто-нибудь объяснить мне разницу между ...
вопрос задан: 4 December 2015 13:47
0
ответов

CUDA несовместима с моей версией gcc

У меня проблемы с компиляцией некоторых примеров поставляется с CUDA SDK. Я установил драйвер разработчика (версия 270.41.19) и инструментарий CUDA, затем, наконец, SDK (обе версии 4.0.17). ...
вопрос задан: 2 December 2015 04:48
0
ответов

Вызов кода CUDA из обычного кода C ++ - сортировка внешнего «C»

Я пытаюсь вызвать Функция CUDA (хост) из файла C ++, скомпилированного отдельно: sample.cpp Файл C ++: extern "C" void cuda_function (int a, int b); int main () {// операторы cuda_function (23, 34); ...
вопрос задан: 26 November 2015 23:06
0
ответов

Могу ли я вызвать функцию времени выполнения CUDA из кода C ++, не скомпилированного nvcc?

Есть ли способ вызвать вызовы функций времени выполнения CUDA, такие как cudaMemcpy (...) ; в файле .cpp, скомпилированном с помощью обычного компилятора C ++?
вопрос задан: 26 November 2015 22:55
0
ответов

Максимальное количество потоков CUDA в блоке

У меня путаница из руководства по программированию. В нем говорится следующее: maxThreadsDim: 512, 512, 64. Когда максимальное количество потоков в блоке может быть 512, как может максимальное ...
вопрос задан: 13 November 2015 13:11
0
ответов

Как я могу скомпилировать код CUDA, а затем связать его с проектом C ++?

Мне нужна помощь, чтобы начать работу с проектом с использованием CUDA. Моя цель - создать проект, который я могу скомпилировать в собственном компиляторе g ++, но использует код CUDA. Я понимаю, что мне нужно скомпилировать ...
вопрос задан: 10 November 2015 00:57
0
ответов

Можно ли поместить инструкции по сборке в код CUDA?

Я хочу использовать код сборки в коде CUDA C чтобы сократить дорогостоящие казни как мы это делаем, используя asm в программировании на C. Возможно ли это?
вопрос задан: 5 November 2015 16:14
0
ответов

Разреженное умножение матрицы на вектор в CUDA

Я пытаюсь реализовать умножение матрицы на вектор на GPU (с использованием CUDA). В моем коде C ++ (CPU) я загружаю матрицу как плотную матрицу, а затем выполняю умножение матрицы на вектор с помощью CUDA ....
вопрос задан: 26 October 2015 22:47
0
ответов

Работа с граничными условиями / областями Halo в CUDA

Я работаю над изображением обработка с помощью CUDA, и я сомневаюсь в обработке пикселей. Что часто происходит с граничными пикселями изображения при применении фильтра свертки amxm? В 3 x 3 ...
вопрос задан: 2 September 2015 08:53