nvidia - список вопросов по программированию nvidia

0

ответов

CUDA определяет потоки на блок, блоков на сетку

Я новичок в CUDA парадигма. Мой вопрос заключается в определении количества потоков на блок и блоков на сетку. Есть ли здесь немного искусства и проб? Я обнаружил, что во многих примерах есть ...

вопрос задан: 8 December 2010 08:58

0

ответов

CUDA Matrix multiplication breaks for large matrices

I have the following matrix multiplication code, implemented using CUDA 3.2 and VS 2008. I am running on Windows server 2008 r2 enterprise. I am running a Nvidia GTX 480. The following code works fine ...

c cuda gpu nvidia gpu-programming

вопрос задан: 4 November 2010 22:22

0

ответов

Сколько циклов задержки памяти для каждого типа доступа к памяти в OpenCL / CUDA?

Я просмотрел руководство по программированию и руководство по передовым методам и упомянул, что доступ к глобальной памяти занимает 400- 600 циклов. Я не видел много других типов памяти, таких как кеш текстур, ...

memory cuda opencl latency nvidia

вопрос задан: 4 November 2010 14:27

0

ответов

CL_OUT_OF_RESOURCES для 2 миллионов чисел с плавающей запятой. с 1 ГБ видеопамяти?

Кажется, 2 миллиона флотов не должны иметь большого значения, всего 8 МБ из 1 ГБ оперативной памяти графического процессора. Иногда я могу выделить столько, а иногда и больше, без проблем. Я получаю CL_OUT_OF_RESOURCES, когда ...

memory opencl nvidia

вопрос задан: 21 October 2010 14:39

0

ответов

Почему OpenCL векторизовал дополнение Nvidia использование SDK в качестве примера асинхронные записи?

Векторный дополнительный пример имеет этот код://Асинхронная запись данных к устройству GPU ciErr1 = clEnqueueWriteBuffer (cqCommandQueue, cmDevSrcA, CL_FALSE, 0, sizeof (cl_float) * szGlobalWorkSize, srcA...

sdk vector opencl nvidia addition

вопрос задан: 20 October 2010 14:30

0

ответов

Параллелизм, 4 Приложения CUDA, конкурирующие за ресурсы графического процессора

Что произойдет, если четыре приложения CUDA одновременно будут конкурировать за ресурсы в одном графическом процессоре, чтобы они могли переложить работу на графическую карту ?. В Руководстве по программированию Cuda 3.1 упоминается ...

c parallel-processing cuda gpgpu nvidia

вопрос задан: 14 September 2010 14:00