0
ответов

Dynamic Allocating memory on GPU

Is it possible to dynamically allocate memory on a GPU's Global memory inside the Kernel? Я не знаю, насколько большим будет мой ответ, поэтому мне нужен способ выделить память для каждой части ответа. ...
вопрос задан: 9 March 2011 16:45
0
ответов

Различия между выводом FFTW и CUFFT

В приведенном ниже символе я сравниваю результаты выполнения IFFT в FFTW и CUFFT. Каковы возможные причины, по которым это выходит иначе? Неужели это ТАКАЯ большая ошибка округления? ...
вопрос задан: 9 March 2011 16:43
0
ответов

Может ли CUDA использовать расширения SIMD?

Я немного погуглил, но сейчас мне непонятно, могут ли некоторые графические процессоры, запрограммированные с помощью CUDA, использовать преимущества или могут использовать инструкции, похожие на от расширений SSE SIMD; например ...
вопрос задан: 8 March 2011 21:48
0
ответов

Почему бы мне просто не создать целое веб-приложение в HTML-шаблонах Javascript и Javascript?

Я подхожу к тому моменту, когда мне нужно начать кэширование вещей, и это заставило меня задуматься. .. В некоторых частях приложения я визуализирую строки таблицы (jqGrid, slickgrid и т. Д.) Или причудливые строки div (например, в ...
вопрос задан: 6 March 2011 19:37
0
ответов

Прикрепленная память по умолчанию против памяти с нулевым копированием

В CUDA мы можем использовать закрепленную память для более эффективного использования скопируйте данные с хоста на графический процессор, чем память по умолчанию, выделенная через malloc на хосте. Однако есть два типа закрепленной памяти по умолчанию ...
вопрос задан: 6 March 2011 07:09
0
ответов

Как определяется использование графического процессора и памяти в результатах nvidia-smi?

В настоящее время я использую инструмент, поставляемый с драйвером nvidia-smi от nvidia для мониторинга производительности на графическом процессоре. Когда мы используем 'nvidia-smi -a', он предоставляет информацию о текущей информации о графическом проц
вопрос задан: 23 February 2011 03:50
0
ответов

Как получить подсветку синтаксиса для файла .cu в Visual Studio?

Я изучаю CUDA на основе Visual Studio 2008. Не могли бы вы рассказать мне, как сделать подсветку синтаксиса в файле .cu file?
вопрос задан: 22 February 2011 10:58
0
ответов

Using CUDA Occupancy Calculator

Я использую калькулятор занятости, но не могу понять, как получить Registers per thread / shared memory per block .I read the documentation.I use visual studio .So in the project properties under ...
вопрос задан: 17 February 2011 19:03
0
ответов

Рекомендации по использованию памяти с нулевым копированием в CUDA

Я пытаюсь понять, подходит ли использование cudaHostAlloc (или cudaMallocHost?). Я пытаюсь запустить ядро, в котором мои входные данные превышают количество, доступное на GPU. Могу ли я ...
вопрос задан: 15 February 2011 18:11
0
ответов

Какие настоящие языковые конструкции C ++ поддерживаются кодом устройства CUDA?

Приложение D версии 3.2 документации CUDA относится к поддержке C ++ в коде устройства CUDA. Ясно упомянуто, что CUDA поддерживает «Классы для устройств с вычислительной способностью 2.x». Однако ...
вопрос задан: 5 February 2011 08:54
0
ответов

NVIDIA CUDA: Что такое драйвер разработчика?

Для разработки программ NVIDIA CUDA необходимы следующие инструменты: Драйверы разработчика Набор инструментов CUDA SDK для вычислений на GPU Что это за драйвер разработчика? Его установка автоматически отменяет любой графический драйвер NVIDIA ...
вопрос задан: 31 January 2011 02:25
0
ответов

выясняя, сколько блоков и потоков для ядра cuda и как их использовать

Я пытался выяснить, как сделать то, что, как я думал, было бы простым ядром, которое принимало бы среднее значение значений в 2-мерная матрица, но у меня возникают некоторые проблемы с ясным мышлением ...
вопрос задан: 27 January 2011 05:07
0
ответов

Функция CUDA может быть вызвана устройством или хостом

У меня есть функция многократного использования в некотором коде CUDA, которую необходимо вызывать как с устройства, так и с хоста. Есть ли для этого подходящая квалификация? например, какое правильное определение для func1 в ...
вопрос задан: 18 January 2011 15:45
0
ответов

CUDA выделяет память в функции __device__

Является ли есть ли способ в CUDA выделить память в функции __device__? Я не мог найти никаких примеров этого. Из руководства: B.15 Распределение динамической глобальной памяти void * malloc (size_t size); ...
вопрос задан: 17 January 2011 16:09
0
ответов

Подходят ли графические процессоры для фильтрации изображений на основе регистра?

Я пытаюсь выяснить, является ли определенная проблема подходящим кандидатом для использования CUDA, чтобы перенести проблему на графический процессор. По сути, я делаю блочный фильтр, который меняется в зависимости от обнаружения края. Итак ...
вопрос задан: 14 January 2011 16:45
0
ответов

Каковы значения по умолчанию для параметров архива и кода при использовании nvcc?

При компиляции кода CUDA вы должны выбрать, для какой архитектуры создается ваш код. nvcc предоставляет два параметра для определения этой архитектуры, в основном: arch указывает виртуальный ...
вопрос задан: 12 January 2011 17:02
0
ответов

NVIDIA против AMD: производительность GPGPU

Я бы хотел услышать мнение людей, имеющих опыт программирования для обоих. Лично у меня только опыт работы с NVIDIA. NVIDIA CUDA кажется намного более популярной, чем конкуренты. (Просто считая вопрос ...
вопрос задан: 9 January 2011 08:27
0
ответов

Ненадежный код GPGPU (OpenCL и т. Д.) - это безопасно? Какие риски?

Есть много подходов, когда речь идет о запуске ненадежного кода на типичном ЦП: песочницы, поддельные корни, виртуализация ... А как насчет ненадежного кода для GPGPU (OpenCL, cuda или уже скомпилированный) ...
вопрос задан: 9 January 2011 02:10
0
ответов

Malloc Повреждение памяти в C

У меня проблема с использованием malloc. У меня есть функция jacobi_gpu, которая вызывается много раз: int main (int argc, char * argv []) {/ * ... * / int totalrot = 0; while (nrot> 0) {...
вопрос задан: 6 January 2011 16:02
0
ответов

Как оптимизировать игру жизни Конвея для CUDA?

Я написал это ядро ​​CUDA. для Конвея ' s игра жизни: __global__ void gameOfLife (float * returnBuffer, int width, int height) {unsigned int x = blockIdx.x * blockDim.x + threadIdx.x; ...
вопрос задан: 2 January 2011 23:54
0
ответов

/ usr / bin / ld: не удается найти -lcutil_x86_64

Я установил последнюю версию nvidia sdk и инструментарий. Когда я запускаю любой из этих примеров sdk, я получаю следующую ошибку: / usr / bin / ld: cannot find -lcutil_x86_64 Любая помощь будет принята с благодарностью.
вопрос задан: 25 December 2010 01:08
0
ответов

CUDA для начинающих - Простое приращение переменной не работает

Я работаю над проект с CUDA. Чтобы понять это, у меня есть следующий код. #include с использованием пространства имен std; __global__ void inc (int * foo) {++ (* foo); } int main () {...
вопрос задан: 10 December 2010 12:31
0
ответов

CUDA and MATLAB for loop optimization

I'm going to attempt to optimize some code written in MATLAB, by using CUDA. I recently started programming CUDA, but I've got a general idea of how it works. So, say I want to add two matrices ...
вопрос задан: 9 December 2010 21:52
0
ответов

CUDA определяет потоки на блок, блоков на сетку

Я новичок в CUDA парадигма. Мой вопрос заключается в определении количества потоков на блок и блоков на сетку. Есть ли здесь немного искусства и проб? Я обнаружил, что во многих примерах есть ...
вопрос задан: 8 December 2010 08:58
0
ответов

Fast Method for computing 3x3 symmetric matrix spectral decomposition

I am working on a project where I'm basically preforming PCA millions of times on sets of 20-100 points. Currently, we are using some legacy code that is using GNU's GSL linear algebra pack to do SVD ...
вопрос задан: 7 December 2010 00:06
0
ответов

Можно ли запустить ядро ​​cuda на нескольких графических процессорах

Это довольно простой вопрос, но поиск в Google, похоже, не дает ответа, так что. Я хочу знать, есть ли у меня две карты gpu (одинаковые), способные запускать cuda, может ли мое ядро ​​охватывать эти карты? ...
вопрос задан: 3 December 2010 15:17
0
ответов

CUDA Beginner - принудительное ожидание завершения потока перед продолжением

Я изучаю CUDA, и у меня есть кое-что вот так на данный момент. __device__ void iterate_temperatures (int fieldSize, Atom * atom) {int temperature = threadIdx.x + blockDim.x * blockIdx.x; ...
вопрос задан: 3 December 2010 12:35
0
ответов

Встраивать V8 в приложение OpenCL?

Я использую OpenCL для написания ядер GPGPU, нацеленных на среду выполнения NVidia CUDA. Я недавно читал о V8 и нашел страницу, описывающую методы встраивания V8: http://code.google.com/apis/v8/...
вопрос задан: 16 November 2010 02:01
0
ответов

Советы / ресурсы для крупномасштабных кроссплатформенных программных проектов

Я собираюсь начать крупномасштабный программный проект, включающий кроссплатформенный графический интерфейс и тяжелый числовой хруст. Я планирую написать большую часть серверной части приложения на C ++ и CUDA, а графический интерфейс - в ...
вопрос задан: 14 November 2010 23:21
0
ответов

Передача структур ядрам CUDA

Я новичок в CUDA C и пытаюсь передать структуру typedef'd в ядро. Мой метод работал нормально, когда я пробовал его со структурой, содержащей только целые числа, но когда я переключаюсь на числа с плавающей запятой, я теряю смысл ...
вопрос задан: 14 November 2010 08:36