0
ответов

выделение памяти устройства и вызов ядра из каждого экземпляра класса

У меня есть класс, который имеет некоторые функции, я хочу создать 8 экземпляров этого класса, а затем каждый экземпляр должен иметь возможность выделить память, необходимую на устройстве, а затем вызвать ядро. Я ...
вопрос задан: 13 July 2018 15:35
0
ответов

Использование общей памяти в наивном шаблоне, соответствующем ядру CUDA?

Я реализовал наивный шаблон, соответствующий ядру CUDA, и мне интересно, как можно использовать разделяемую память, чтобы сделать вещи немного быстрее. Вот мой код, и цель - это первое ядро. #include & lt; ...
вопрос задан: 13 July 2018 05:01
0
ответов

Могу ли я остановить все процессы, использующие CUDA в Linux, без перезагрузки?

Можно ли остановить всю текущую обработку с использованием графического процессора через CUDA, не перезагружая машину?
вопрос задан: 2 July 2018 20:27
0
ответов

Как в ядре CUDA сохранить массив в «локальной памяти потока»?

Я пытаюсь разработать небольшую программу с CUDA, но, поскольку она была МЕДЛЕННОЙ, я сделал несколько тестов и немного погуглил. Я обнаружил, что хотя отдельные переменные по умолчанию хранятся в памяти локального потока,...
вопрос задан: 3 June 2018 16:32
0
ответов

- это локальная память медленнее, чем совместивая память в CUDA?

Я нашел замечание только на то, что локальная память медленнее, чем регистрировать память, типы двух потоков. Общая память должна быть быстрой, но это быстрее, чем локальная память [резьба]? Что я.
вопрос задан: 3 June 2018 16:28
0
ответов

Использование Java с графическими процессорами Nvidia (cuda)

Я работаю над бизнес-проектом, который выполняется в Java и требует огромных вычислительных мощностей для вычисления бизнес-рынков. Простая математика, но с огромным количеством данных. Мы заказали немного CUDA GPU, чтобы попробовать это ...
вопрос задан: 23 April 2018 14:16
0
ответов

Указатели меньшего размера… возможны? (без системы с более низкими спецификациями)

В этой статье 2010 года [1] о лучевой передаче разреженных октодеревьев вокселей (SVO) (извинения; документ требует времени для загрузки), раздел 3 указывает на интересную настройку памяти для экономии места на данных вокселей. , который почти ...
вопрос задан: 19 April 2018 01:13
0
ответов

распределение разделяемой памяти

Я пытаюсь выделить разделяемую память, используя постоянный параметр, но получаю сообщение об ошибке. мое ядро ​​выглядит так: __global__ void Kernel (const int count) {__shared__ int a [количество]; } и я ...
вопрос задан: 27 March 2018 13:29
0
ответов

Как разделены ли блоки CUDA на деформации?

Если я начну ядро ​​с сеткой, блоки которой имеют размеры: dim3 block_dims (16,16); Как блоки сетки теперь разделяются на деформации? Первые два ряда такого блока формируют одну деформацию, или первую ...
вопрос задан: 16 March 2018 21:57
0
ответов

Как определить общую память CUDA с размером, известным во время выполнения?

__shared__ память в CUDA требует известного размера во время компиляции. Однако в моей проблеме размер __shared__ памяти известен только во время выполнения, то есть int size=get_size(); __shared__ mem[size]...
вопрос задан: 16 January 2018 18:27
0
ответов

список индексов белых пикселей на изображении с использованием CUDA

Учитывая двоичное изображение, я хочу вернуть список индексов для белых пикселей в нем, используя GPU (Compute Unified Device Architecture). Как определить индекс для вектора точек? Вот ядро ​​CUDA ...
вопрос задан: 23 November 2017 15:05
0
ответов

Модель согласованности памяти CUDA 4.0 и глобальная память?

Обновление :Приведенное ниже условие while ()оптимизируется компилятором, поэтому оба потока просто пропускают условие и входят в CS даже с флагом -O0. Кто-нибудь знает, почему компилятор это делает?...
вопрос задан: 22 November 2017 02:50
0
ответов

Как создать ассемблер графического процессора или управлять им?

Есть ли у кого-нибудь опыт создания / управления машинным кодом графического процессора, возможно, во время выполнения? Я заинтересован в изменении кода ассемблера графического процессора, возможно, во время выполнения с минимальными накладными расходами
вопрос задан: 27 October 2017 21:42
0
ответов

Потоки CUDA не перекрываются

У меня есть что-то очень похожее на код: int k, no_streams = 4; поток cudaStream_t [no_streams]; для (k = 0; k
вопрос задан: 26 October 2017 23:59
0
ответов

Как уменьшить задержку/задержку синхронизации CUDA

Этот вопрос связан с использованием потоков cuda для запуска многих ядер. В CUDA есть много команд синхронизации. cudaStreamSynchronize, CudaDeviceSynchronize, cudaThreadSynchronize, а также...
вопрос задан: 26 October 2017 23:59
0
ответов

Кодирование CUDA с помощью C #?

Я искал некоторую информацию о кодировании CUDA (язык графических процессоров nvidia) с помощью C #. Я видел несколько библиотек, но кажется, что они добавят немного накладных расходов (из-за p / ...
вопрос задан: 17 October 2017 14:02
0
ответов

CMake Error: переменные установлены в NOTFOUND

Сначала я установил cuda, используя cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb. Теперь я пытаюсь установить OpenCV 3.3.0 Но я получаю CMake Error: CMake Error: Следующие переменные используются в ...
вопрос задан: 6 October 2017 10:38
0
ответов

Постоянное использование памяти в коде CUDA

Сам не могу разобраться, как лучше чтобы обеспечить постоянство памяти, используемой в моем ядре. Аналогичный вопрос есть на http: //stackoverflow...r-pleasant-way. Я работаю с GTX580 ...
вопрос задан: 20 September 2017 09:02
0
ответов

Почему в CUDA ограничен постоянный размер памяти?

В соответствии с "Руководством по программированию CUDA C", постоянный доступ к памяти дает преимущества только в том случае, если происходит попадание в многопроцессорный постоянный кэш (Раздел 5.3.2.4 )1. В противном случае может быть еще больше запросо
вопрос задан: 20 September 2017 09:01
0
ответов

Правильный способ написания функций ядра в CUDA?

Я как раз собираюсь приступить к преобразованию программы, которую я написал, в CUDA, чтобы, надеюсь, увеличить скорость обработки. Теперь очевидно, что моя старая программа выполняет множество функций одну за другой, и у меня есть...
вопрос задан: 9 August 2017 04:33
0
ответов

CUDA: Сколько всего параллельных потоков?

У меня есть GeForce GTX 580, и я хочу сделать заявление об общем количестве потоков, которые (в идеале) могут быть запущены параллельно, для сравнения с 2 или 4 многоядерными CPU. deviceQuery дает ...
вопрос задан: 30 July 2017 06:27
0
ответов

Получение переполнения стека с помощью ядра CUDA

У меня огромная проблема с кодом, который я программирую. Я не эксперт, и я - спрашивал много людей перед тем, как прийти сюда. Я тоже многое исправил. Так что, думаю, я готов показать вам код и ...
вопрос задан: 18 July 2017 10:44
0
ответов

CUDA текстуры кубических карт

Как работать с текстурами карт кубов OpenGL в CUDA? Когда кто-то хочет использовать текстуры OpenGL в ядре CUDA, одна из вещей, которую нужно сделать, - это извлечь массив CUDA из зарегистрированного изображения и сопоставленного ресурса ...
вопрос задан: 4 June 2017 05:20
0
ответов

Как включить в файл .cpp

У меня проблема с включением в файл .cpp. Ошибка: не удается включить файл: cuda_runtime.h: нет такого файла или каталога. Я пытаюсь выполнить код Роба Фарбера (http://www.drdobbs....
вопрос задан: 31 May 2017 03:32
0
ответов

Привязки Erlang для CUDA или OpenCL

Я нашел это сообщение на Erlang и CUDA, оно довольно старое, поэтому я хотел бы узнать, изменилось ли что-то с момента публикации этого вопроса. Я хотел бы знать, есть ли какая-либо реализация ...
вопрос задан: 23 May 2017 12:26
0
ответов

Несколько потоков записывают одно и то же значение в одну и ту же область глобальной памяти

Этот вопрос тесно связан с этим, но мой относится к миру CUDA. В моем ядре есть несколько потоков, которые могут записывать одно и то же значение в одну и ту же область глобальной памяти. Это ...
вопрос задан: 23 May 2017 12:25
0
ответов

Как рассчитать гигафлопс ядра

Мне нужно измерить, какую пиковую производительность хранит мое ядро. Скажем, у меня есть NVIDIA Tesla C1060 с пиковым значением GFLOPS 622,08 (~ = 240 ядер * 1300 МГц * 2). Теперь в своем ядре я посчитал ...
вопрос задан: 23 May 2017 12:17
0
ответов

Постоянная память vs текстурная память vs глобальная память в CUDA

Я пытаюсь найти различия между постоянной памятью vs текстурной памятью vs глобальной памятью в CUDA. Я смог найти следующие соответствующие статьи, но не смог найти ответ на свой ...
вопрос задан: 23 May 2017 12:04
0
ответов

blocks, threads, warpSize

Было много дискуссий о том, как выбрать #blocks и blockSize, но я все еще кое-что упускаю. Многие из моих опасений связаны с этим вопросом: как CUDA Blocks/Warps/Threads отображаются на CUDA...
вопрос задан: 23 May 2017 12:03
0
ответов

Makefile для CUDA и C

Я работаю над проектом, в котором используются файлы .c и .cu. Первоначальный пакет был полностью написан на C и имел собственный Makefile (он отлично работал). Я добавил файл .cu в проект, и теперь я...
вопрос задан: 23 May 2017 12:00