0
ответов

CUDA определяет потоки на блок, блоков на сетку

Я новичок в CUDA парадигма. Мой вопрос заключается в определении количества потоков на блок и блоков на сетку. Есть ли здесь немного искусства и проб? Я обнаружил, что во многих примерах есть ...
вопрос задан: 8 December 2010 08:58
0
ответов

CUDA Matrix multiplication breaks for large matrices

I have the following matrix multiplication code, implemented using CUDA 3.2 and VS 2008. I am running on Windows server 2008 r2 enterprise. I am running a Nvidia GTX 480. The following code works fine ...
вопрос задан: 4 November 2010 22:22
0
ответов

Сколько циклов задержки памяти для каждого типа доступа к памяти в OpenCL / CUDA?

Я просмотрел руководство по программированию и руководство по передовым методам и упомянул, что доступ к глобальной памяти занимает 400- 600 циклов. Я не видел много других типов памяти, таких как кеш текстур, ...
вопрос задан: 4 November 2010 14:27
0
ответов

CL_OUT_OF_RESOURCES для 2 миллионов чисел с плавающей запятой. с 1 ГБ видеопамяти?

Кажется, 2 миллиона флотов не должны иметь большого значения, всего 8 МБ из 1 ГБ оперативной памяти графического процессора. Иногда я могу выделить столько, а иногда и больше, без проблем. Я получаю CL_OUT_OF_RESOURCES, когда ...
вопрос задан: 21 October 2010 14:39
0
ответов

Почему OpenCL векторизовал дополнение Nvidia использование SDK в качестве примера асинхронные записи?

Векторный дополнительный пример имеет этот код://Асинхронная запись данных к устройству GPU ciErr1 = clEnqueueWriteBuffer (cqCommandQueue, cmDevSrcA, CL_FALSE, 0, sizeof (cl_float) * szGlobalWorkSize, srcA...
вопрос задан: 20 October 2010 14:30
0
ответов

Параллелизм, 4 Приложения CUDA, конкурирующие за ресурсы графического процессора

Что произойдет, если четыре приложения CUDA одновременно будут конкурировать за ресурсы в одном графическом процессоре, чтобы они могли переложить работу на графическую карту ?. В Руководстве по программированию Cuda 3.1 упоминается ...
вопрос задан: 14 September 2010 14:00