cuda - список вопросов по программированию cuda

ответов

выделение памяти устройства и вызов ядра из каждого экземпляра класса

У меня есть класс, который имеет некоторые функции, я хочу создать 8 экземпляров этого класса, а затем каждый экземпляр должен иметь возможность выделить память, необходимую на устройстве, а затем вызвать ядро. Я ...

pointers cuda

вопрос задан: 13 July 2018 15:35

ответов

Использование общей памяти в наивном шаблоне, соответствующем ядру CUDA?

Я реализовал наивный шаблон, соответствующий ядру CUDA, и мне интересно, как можно использовать разделяемую память, чтобы сделать вещи немного быстрее. Вот мой код, и цель - это первое ядро. #include & lt; ...

cuda

вопрос задан: 13 July 2018 05:01

ответов

Могу ли я остановить все процессы, использующие CUDA в Linux, без перезагрузки?

Можно ли остановить всю текущую обработку с использованием графического процессора через CUDA, не перезагружая машину?

cuda restart kill-process

вопрос задан: 2 July 2018 20:27

ответов

Как в ядре CUDA сохранить массив в «локальной памяти потока»?

Я пытаюсь разработать небольшую программу с CUDA, но, поскольку она была МЕДЛЕННОЙ, я сделал несколько тестов и немного погуглил. Я обнаружил, что хотя отдельные переменные по умолчанию хранятся в памяти локального потока,...

arrays cuda gpu-local-memory memory

вопрос задан: 3 June 2018 16:32

ответов

- это локальная память медленнее, чем совместивая память в CUDA?

Я нашел замечание только на то, что локальная память медленнее, чем регистрировать память, типы двух потоков. Общая память должна быть быстрой, но это быстрее, чем локальная память [резьба]? Что я.

c cuda gpu-programming gpu-shared-memory gpu-local-memory

вопрос задан: 3 June 2018 16:28

ответов

Использование Java с графическими процессорами Nvidia (cuda)

Я работаю над бизнес-проектом, который выполняется в Java и требует огромных вычислительных мощностей для вычисления бизнес-рынков. Простая математика, но с огромным количеством данных. Мы заказали немного CUDA GPU, чтобы попробовать это ...

multi-gpu gpu-programming cuda java

вопрос задан: 23 April 2018 14:16

ответов

Указатели меньшего размера… возможны? (без системы с более низкими спецификациями)

В этой статье 2010 года [1] о лучевой передаче разреженных октодеревьев вокселей (SVO) (извинения; документ требует времени для загрузки), раздел 3 указывает на интересную настройку памяти для экономии места на данных вокселей. , который почти ...

c++ pointers memory cuda

вопрос задан: 19 April 2018 01:13

ответов

распределение разделяемой памяти

Я пытаюсь выделить разделяемую память, используя постоянный параметр, но получаю сообщение об ошибке. мое ядро выглядит так: __global__ void Kernel (const int count) {__shared__ int a [количество]; } и я ...

c++ c cuda gpu-shared-memory

вопрос задан: 27 March 2018 13:29

ответов

Как разделены ли блоки CUDA на деформации?

Если я начну ядро с сеткой, блоки которой имеют размеры: dim3 block_dims (16,16); Как блоки сетки теперь разделяются на деформации? Первые два ряда такого блока формируют одну деформацию, или первую ...

cuda gpgpu gpu-warp

вопрос задан: 16 March 2018 21:57

ответов

Как определить общую память CUDA с размером, известным во время выполнения?

__shared__ память в CUDA требует известного размера во время компиляции. Однако в моей проблеме размер __shared__ памяти известен только во время выполнения, то есть int size=get_size(); __shared__ mem[size]...

cuda gpu-shared-memory

вопрос задан: 16 January 2018 18:27

ответов

список индексов белых пикселей на изображении с использованием CUDA

Учитывая двоичное изображение, я хочу вернуть список индексов для белых пикселей в нем, используя GPU (Compute Unified Device Architecture). Как определить индекс для вектора точек? Вот ядро CUDA ...

cuda image-processing c++

вопрос задан: 23 November 2017 15:05

ответов

Модель согласованности памяти CUDA 4.0 и глобальная память?

Обновление :Приведенное ниже условие while ()оптимизируется компилятором, поэтому оба потока просто пропускают условие и входят в CS даже с флагом -O0. Кто-нибудь знает, почему компилятор это делает?...

cpu-architecture cuda parallel-processing memory

вопрос задан: 22 November 2017 02:50

ответов

Как создать ассемблер графического процессора или управлять им?

Есть ли у кого-нибудь опыт создания / управления машинным кодом графического процессора, возможно, во время выполнения? Я заинтересован в изменении кода ассемблера графического процессора, возможно, во время выполнения с минимальными накладными расходами

assembly stream cuda gpgpu

вопрос задан: 27 October 2017 21:42

ответов

Потоки CUDA не перекрываются

У меня есть что-то очень похожее на код: int k, no_streams = 4; поток cudaStream_t [no_streams]; для (k = 0; k

cuda cuda-streams

вопрос задан: 26 October 2017 23:59

ответов

Как уменьшить задержку/задержку синхронизации CUDA

Этот вопрос связан с использованием потоков cuda для запуска многих ядер. В CUDA есть много команд синхронизации. cudaStreamSynchronize, CudaDeviceSynchronize, cudaThreadSynchronize, а также...

concurrency cuda-streams cuda synchronize latency

вопрос задан: 26 October 2017 23:59

ответов

Кодирование CUDA с помощью C #?

Я искал некоторую информацию о кодировании CUDA (язык графических процессоров nvidia) с помощью C #. Я видел несколько библиотек, но кажется, что они добавят немного накладных расходов (из-за p / ...

c# cuda

вопрос задан: 17 October 2017 14:02

ответов

CMake Error: переменные установлены в NOTFOUND

Сначала я установил cuda, используя cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb. Теперь я пытаюсь установить OpenCV 3.3.0 Но я получаю CMake Error: CMake Error: Следующие переменные используются в ...

ubuntu-16.04 cuda cmake opencv

вопрос задан: 6 October 2017 10:38

ответов

Постоянное использование памяти в коде CUDA

Сам не могу разобраться, как лучше чтобы обеспечить постоянство памяти, используемой в моем ядре. Аналогичный вопрос есть на http: //stackoverflow...r-pleasant-way. Я работаю с GTX580 ...

c memory-management cuda constants gpu-constant-memory

вопрос задан: 20 September 2017 09:02

ответов

Почему в CUDA ограничен постоянный размер памяти?

В соответствии с "Руководством по программированию CUDA C", постоянный доступ к памяти дает преимущества только в том случае, если происходит попадание в многопроцессорный постоянный кэш (Раздел 5.3.2.4 )1. В противном случае может быть еще больше запросо

cuda gpgpu gpu-constant-memory

вопрос задан: 20 September 2017 09:01

ответов

Правильный способ написания функций ядра в CUDA?

Я как раз собираюсь приступить к преобразованию программы, которую я написал, в CUDA, чтобы, надеюсь, увеличить скорость обработки. Теперь очевидно, что моя старая программа выполняет множество функций одну за другой, и у меня есть...

c cuda c++ labview

вопрос задан: 9 August 2017 04:33

ответов

CUDA: Сколько всего параллельных потоков?

У меня есть GeForce GTX 580, и я хочу сделать заявление об общем количестве потоков, которые (в идеале) могут быть запущены параллельно, для сравнения с 2 или 4 многоядерными CPU. deviceQuery дает ...

cuda gpgpu

вопрос задан: 30 July 2017 06:27

ответов

Получение переполнения стека с помощью ядра CUDA

У меня огромная проблема с кодом, который я программирую. Я не эксперт, и я - спрашивал много людей перед тем, как прийти сюда. Я тоже многое исправил. Так что, думаю, я готов показать вам код и ...

c pointers cuda stack-overflow parallel-processing

вопрос задан: 18 July 2017 10:44

ответов

CUDA текстуры кубических карт

Как работать с текстурами карт кубов OpenGL в CUDA? Когда кто-то хочет использовать текстуры OpenGL в ядре CUDA, одна из вещей, которую нужно сделать, - это извлечь массив CUDA из зарегистрированного изображения и сопоставленного ресурса ...

gpu cuda opengl

вопрос задан: 4 June 2017 05:20

ответов

Как включить в файл .cpp

У меня проблема с включением в файл .cpp. Ошибка: не удается включить файл: cuda_runtime.h: нет такого файла или каталога. Я пытаюсь выполнить код Роба Фарбера (http://www.drdobbs....

cuda visual-studio

вопрос задан: 31 May 2017 03:32

ответов

Привязки Erlang для CUDA или OpenCL

Я нашел это сообщение на Erlang и CUDA, оно довольно старое, поэтому я хотел бы узнать, изменилось ли что-то с момента публикации этого вопроса. Я хотел бы знать, есть ли какая-либо реализация ...

erlang cuda scalability opencl

вопрос задан: 23 May 2017 12:26

ответов

Несколько потоков записывают одно и то же значение в одну и ту же область глобальной памяти

Этот вопрос тесно связан с этим, но мой относится к миру CUDA. В моем ядре есть несколько потоков, которые могут записывать одно и то же значение в одну и ту же область глобальной памяти. Это ...

cuda

вопрос задан: 23 May 2017 12:25

ответов

Как рассчитать гигафлопс ядра

Мне нужно измерить, какую пиковую производительность хранит мое ядро. Скажем, у меня есть NVIDIA Tesla C1060 с пиковым значением GFLOPS 622,08 (~ = 240 ядер * 1300 МГц * 2). Теперь в своем ядре я посчитал ...

profiling cuda

вопрос задан: 23 May 2017 12:17

ответов

Постоянная память vs текстурная память vs глобальная память в CUDA

Я пытаюсь найти различия между постоянной памятью vs текстурной памятью vs глобальной памятью в CUDA. Я смог найти следующие соответствующие статьи, но не смог найти ответ на свой ...

memory cuda textures

вопрос задан: 23 May 2017 12:04

ответов

blocks, threads, warpSize

Было много дискуссий о том, как выбрать #blocks и blockSize, но я все еще кое-что упускаю. Многие из моих опасений связаны с этим вопросом: как CUDA Blocks/Warps/Threads отображаются на CUDA...

cuda warp-scheduler

вопрос задан: 23 May 2017 12:03

ответов

Makefile для CUDA и C

Я работаю над проектом, в котором используются файлы .c и .cu. Первоначальный пакет был полностью написан на C и имел собственный Makefile (он отлично работал). Я добавил файл .cu в проект, и теперь я...

c cuda nvcc makefile

вопрос задан: 23 May 2017 12:00