5
ответов

Время ожидания приложений CUDA & amp; потерпеть неудачу через несколько секунд - как обойти это?

Я заметил, что приложения CUDA обычно имеют приблизительное максимальное время выполнения 5-15 секунд, прежде чем они выйдут из строя и выйдут. Я понимаю, что идеально, чтобы приложение CUDA не запускалось так долго, но ...
вопрос задан: 2 December 2013 07:13
4
ответа

printf внутри функции CUDA __global__

В настоящее время я пишу матричное умножение на графическом процессоре и хотел бы отладить свой код, но поскольку я не могу использовать printf внутри функции устройства, есть ли что-то еще, что я могу сделать, чтобы увидеть, что происходит ...
вопрос задан: 24 December 2018 08:44
4
ответа

Как я тестирую OpenCL на GPU при удаленном входе в систему на Mac?

Моя программа OpenCL может найти устройство GPU, когда я зарегистрирован в консоли, но не, когда я зарегистрирован удаленно с ssh. Далее, если я запускаю программу как корень на ssh сессии, программа может...
вопрос задан: 20 January 2010 16:53
4
ответа

предложения на проекте в C++ / распределенные системы / сети

Я хотел бы работать над проектом 2-3 месяца длиной (полный рабочий день), который вовлекает кодирование в C++ и связан с сетями (стеки протоколов). Я рассматривал запись моего собственного сетевого стека, но это не кажется...
вопрос задан: 5 June 2009 18:16
3
ответа

Как я могу использовать GPU в качестве второго процессора в .NET?

Вопрос говорит все это действительно. Я надеюсь, что не должен написать код в C++ .dll и затем назвать его из управляемого кода.
вопрос задан: 22 January 2009 19:54
2
ответа

Почему я получаю CL_MEM_OBJECT_ALLOCATION_FAILURE?

Я выделяю буфер cl_mem на GPU и работу над ним, которая хорошо работает, пока определенный размер не превышен. В этом случае само выделение успешно выполняется, но выполнение или копирование не делают. Я действительно хочу...
вопрос задан: 12 April 2013 12:06
2
ответа

Скопируйте данные в gpuarray с двумя разными поведениями [duplicate]

Случай 1: Использование стека для получения pts s = (np.array ([371, 430, 856, 1002]), np.array ([558, 77, 653, 230])) pts = np.vstack (s). T.astype (np.float32) pts output: array ([[371., 558.], [430., ...
вопрос задан: 1 August 2011 16:58
2
ответа

Компиляция примеров NVIDIA CUDA SDK Неподдерживаемая архитектура 'compute_20'

При компиляции CUDA SDK я получаю nvcc фатальный: Неподдерживаемая архитектура gpu 'compute_20' Мой инструментарий - 2.3 и в общей системе (то есть не могу обновить), а также версия драйвера ...
вопрос задан: 15 June 2010 21:24
1
ответ

С CUDA существует ли ограничение на количество вычислений или количество разрешенных блоков? [Дубликат]

Я изучаю CUDA 8.0 с Visual Studio 2015 (работает на GeForce GTX 1060). Я попытался установить 2000 блоков для запуска 1024 потоков каждый (значения, которые поддерживаются), но я получаю код ошибки 4 после ...
вопрос задан: 6 July 2013 11:07
1
ответ

Есть ли алгоритм для сортировки массива строк для GPU?

Массив к виду имеет приблизительно один миллион строк, где каждая строка может иметь длину до одного миллиона символов. Я ищу любую реализацию сортировки алгоритма для GPU. У меня есть блок...
вопрос задан: 15 July 2010 13:17
1
ответ

Как определить, использует ли приложение GPU

Я ищу способ определить, как знать, использует ли приложение GPU с Objective C. Я хочу смочь определить, имеют ли какие-либо приложения, в настоящее время работающие на системе, работу...
вопрос задан: 7 May 2010 18:31
0
ответов

Настройка Visual Studio Intellisense для вызовов ядра CUDA

Я только начал программировать CUDA, и все идет довольно хорошо, мой GPU распознаются и все. Я частично настроил Intellisense в Visual Studio, используя это чрезвычайно полезное руководство здесь: ...
вопрос задан: 10 August 2019 11:18
0
ответов

Массив OpenCL, возвращающий 0

Я относительно новичок в OpenCL и у меня проблемы с доступом к массиву. Я использую printf для отладки программы. (Предположительно надуманный) код выглядит следующим образом: __constant static int array_2 [4] = {...
вопрос задан: 5 March 2019 17:02
0
ответов

- это локальная память медленнее, чем совместивая память в CUDA?

Я нашел замечание только на то, что локальная память медленнее, чем регистрировать память, типы двух потоков. Общая память должна быть быстрой, но это быстрее, чем локальная память [резьба]? Что я.
вопрос задан: 3 June 2018 16:28
0
ответов

Использование Java с графическими процессорами Nvidia (cuda)

Я работаю над бизнес-проектом, который выполняется в Java и требует огромных вычислительных мощностей для вычисления бизнес-рынков. Простая математика, но с огромным количеством данных. Мы заказали немного CUDA GPU, чтобы попробовать это ...
вопрос задан: 23 April 2018 14:16
0
ответов

Могу ли я запустить CUDA на встроенном графическом процессоре Intel?

У меня очень простой ноутбук Toshiba с процессором i3. Кроме того, у меня нет дорогой видеокарты. В настройках дисплея я вижу Intel (HD) Graphics как адаптер дисплея. Планирую изучить ...
вопрос задан: 16 February 2017 18:00
0
ответов

На что похож CUDA? Для чего это? Каковы преимущества? А с чего начать?

Я заинтересован в разработке новых технологий и подумывал попробовать CUDA. Теперь ... их документация слишком техническая и не дает ответов, которые я ищу. Кроме того, я бы ...
вопрос задан: 23 January 2017 20:38
0
ответов

What do work items execute when conditionals are used in GPU programming?

If you have work items executing in a wavefront and there is a conditional such as: if(x){ ... } else{ .... } What do the work-items execute? is it the case whereby all ...
вопрос задан: 30 March 2016 22:21
0
ответов

Как управляется память CUDA?

Когда я запускаю свою программу CUDA, которая выделяет лишь небольшой объем глобальной памяти (менее 20 М), я получаю ошибку "out of memory". (Судя по сообщениям других людей, я думаю, что проблема связана с памятью ...
вопрос задан: 15 January 2016 06:05
0
ответов

Почему не удается найти libcudart.so.4 при компиляции образцов CUDA в Ubuntu?

Я пытаюсь запустить образцы Cuda SDK, но получаю следующую ошибку: ./bandwidthTest: ошибка при загрузке общих библиотек: libcudart.so.4: невозможно открыть общий объектный файл: ...
вопрос задан: 11 June 2013 14:24
0
ответов

я могу вычислить normals в gpu?

У меня есть opengl приложение, которое загружает dxf и тянет его на экране, каждый раз, когда я должен вычислить, normals. является там способом вычислить normals в GPU вместо ЦП? раз так, как?
вопрос задан: 8 April 2013 12:17
0
ответов

Какой код Java можно перенести на GPU?

Благодаря фреймворку rootbeer возможно программирование на GPU для Java. Какой код Java следует использовать для rootbeer и какой код лучше запускать на виртуальной машине Java? Или другой :, код которого производит...
вопрос задан: 12 August 2012 18:11
0
ответов

Является ли limited(amp) более строгим, чем код ядра CUDA?

В C++ AMP функции ядра или лямбда-выражения помечены с помощью limit(amp), что налагает строгие ограничения на разрешенное подмножество C++ (перечислено здесь). Предоставляет ли CUDA больше свободы для подмножества C++...
вопрос задан: 10 August 2012 18:33
0
ответов

Связывание со сторонними библиотеками CUDA замедляет cudaMalloc

Не секрет, что в CUDA 4.x первый вызов cudaMalloc может быть смехотворно медленным (, о чем сообщалось несколько раз ), по-видимому, ошибка в драйверах CUDA. Недавно я заметил странное поведение :в...
вопрос задан: 26 July 2012 08:34
0
ответов

ГП читает из ЦП или ЦП записывает в ГП?

Я новичок в параллельном программировании. У меня есть вопрос, который может показаться глупым, но я не получил окончательного ответа, когда искал его в Google. В вычислениях на GPU есть устройство, то есть GPU и...
вопрос задан: 2 July 2012 19:14
0
ответов

Nsight пропускает (игнорирует) контрольные точки в VS10 Cuda работает нормально, nsight постоянно пропускает несколько контрольных точек

Я использую nsight 2.2, Toolkit 4.2, последнюю версию драйвера nvidia, Я использую пару графических процессоров на своем компьютере. Сборка по индивидуальному заказу 4.2. Я установил «генерировать вывод GPU» в свойствах проекта CUDA, монитор nsight ...
вопрос задан: 1 June 2012 16:07
0
ответов

CUDA/openCL; переписывание ветвей как выражение без ветвления

В большинстве случаев ветвь требуется в программе CUDA или OpenCL, например: for (int i=0; i
вопрос задан: 15 May 2012 21:53
0
ответов

в чем разница между «-arch sm _13» и «-arch sm _20»

В моем приложении мне нужен расчет с двойной точностью. Согласно тому, что я нашел в Google, я должен добавить флаг «-arch sm _13» или «-arch sm _20». Q1 :В чем разница между "-arch sm _13" и "-arch...
вопрос задан: 3 May 2012 07:21
0
ответов

Странная ошибка при использовании cudaMemcpy: cudaErrorLaunchFailure

У меня есть код CUDA, который работает следующим образом: cpyDataGPU --> CPU while(nsteps){ cudaKernel1<<<,>> > функция1(); cudaKernel2<<<,>>> } ...
вопрос задан: 24 April 2012 20:43
0
ответов

Ищу API для использования замечательных возможностей графического процессора из .NET.

Я ищу хороший API для реализации алгоритмов на графическом процессоре. Я бы предпочел что-то относительно простое и гибкое. Я ищу не самую хардкорную производительность, а что-то...
вопрос задан: 8 April 2012 12:15