0
ответов

- это локальная память медленнее, чем совместивая память в CUDA?

Я нашел замечание только на то, что локальная память медленнее, чем регистрировать память, типы двух потоков. Общая память должна быть быстрой, но это быстрее, чем локальная память [резьба]? Что я.
вопрос задан: 3 June 2018 16:28
0
ответов

распределение разделяемой памяти

Я пытаюсь выделить разделяемую память, используя постоянный параметр, но получаю сообщение об ошибке. мое ядро ​​выглядит так: __global__ void Kernel (const int count) {__shared__ int a [количество]; } и я ...
вопрос задан: 27 March 2018 13:29
0
ответов

Как определить общую память CUDA с размером, известным во время выполнения?

__shared__ память в CUDA требует известного размера во время компиляции. Однако в моей проблеме размер __shared__ памяти известен только во время выполнения, то есть int size=get_size(); __shared__ mem[size]...
вопрос задан: 16 January 2018 18:27
0
ответов

Есть ли ограничение на локальную память OpenCL?

Сегодня я добавил в свое ядро ​​еще четыре __local переменных, чтобы вывести промежуточные результаты. Но просто добавив еще четыре переменных в сигнатуру ядра и добавление соответствующих аргументов ядра ...
вопрос задан: 22 November 2017 22:02
0
ответов

​​Размер разделяемой памяти GPU очень мал - что я могу с этим поделать?

Размер разделяемой памяти («локальная память» в терминах OpenCL) составляет всего 16 Кбайт на большинстве современных графических процессоров NVIDIA. У меня есть приложение, в котором мне нужно создать массив из 10 000 целых чисел. так что ...
вопрос задан: 4 May 2016 17:40