Я заметил, что приложения CUDA обычно имеют приблизительное максимальное время выполнения 5-15 секунд, прежде чем они выйдут из строя и выйдут. Я понимаю, что идеально, чтобы приложение CUDA не запускалось так долго, но ...
В настоящее время я пишу матричное умножение на графическом процессоре и хотел бы отладить свой код, но поскольку я не могу использовать printf внутри функции устройства, есть ли что-то еще, что я могу сделать, чтобы увидеть, что происходит ...
Моя программа OpenCL может найти устройство GPU, когда я зарегистрирован в консоли, но не, когда я зарегистрирован удаленно с ssh. Далее, если я запускаю программу как корень на ssh сессии, программа может...
Я хотел бы работать над проектом 2-3 месяца длиной (полный рабочий день), который вовлекает кодирование в C++ и связан с сетями (стеки протоколов). Я рассматривал запись моего собственного сетевого стека, но это не кажется...
Я выделяю буфер cl_mem на GPU и работу над ним, которая хорошо работает, пока определенный размер не превышен. В этом случае само выделение успешно выполняется, но выполнение или копирование не делают. Я действительно хочу...
При компиляции CUDA SDK я получаю nvcc фатальный: Неподдерживаемая архитектура gpu 'compute_20' Мой инструментарий - 2.3 и в общей системе (то есть не могу обновить), а также версия драйвера ...
Я изучаю CUDA 8.0 с Visual Studio 2015 (работает на GeForce GTX 1060). Я попытался установить 2000 блоков для запуска 1024 потоков каждый (значения, которые поддерживаются), но я получаю код ошибки 4 после ...
Массив к виду имеет приблизительно один миллион строк, где каждая строка может иметь длину до одного миллиона символов. Я ищу любую реализацию сортировки алгоритма для GPU. У меня есть блок...
Я ищу способ определить, как знать, использует ли приложение GPU с Objective C. Я хочу смочь определить, имеют ли какие-либо приложения, в настоящее время работающие на системе, работу...
Я только начал программировать CUDA, и все идет довольно хорошо, мой GPU распознаются и все. Я частично настроил Intellisense в Visual Studio, используя это чрезвычайно полезное руководство здесь: ...
Я относительно новичок в OpenCL и у меня проблемы с доступом к массиву. Я использую printf для отладки программы. (Предположительно надуманный) код выглядит следующим образом: __constant static int array_2 [4] = {...
Я нашел замечание только на то, что локальная память медленнее, чем регистрировать память, типы двух потоков. Общая память должна быть быстрой, но это быстрее, чем локальная память [резьба]? Что я.
Я работаю над бизнес-проектом, который выполняется в Java и требует огромных вычислительных мощностей для вычисления бизнес-рынков. Простая математика, но с огромным количеством данных. Мы заказали немного CUDA GPU, чтобы попробовать это ...
У меня очень простой ноутбук Toshiba с процессором i3. Кроме того, у меня нет дорогой видеокарты. В настройках дисплея я вижу Intel (HD) Graphics как адаптер дисплея. Планирую изучить ...
Я заинтересован в разработке новых технологий и подумывал попробовать CUDA. Теперь ... их документация слишком техническая и не дает ответов, которые я ищу. Кроме того, я бы ...
If you have work items executing in a wavefront and there is a conditional such as: if(x){ ... } else{ .... } What do the work-items execute? is it the case whereby all ...
Когда я запускаю свою программу CUDA, которая выделяет лишь небольшой объем глобальной памяти (менее 20 М), я получаю ошибку "out of memory". (Судя по сообщениям других людей, я думаю, что проблема связана с памятью ...
Я пытаюсь запустить образцы Cuda SDK, но получаю следующую ошибку: ./bandwidthTest: ошибка при загрузке общих библиотек: libcudart.so.4: невозможно открыть общий объектный файл: ...
У меня есть opengl приложение, которое загружает dxf и тянет его на экране, каждый раз, когда я должен вычислить, normals. является там способом вычислить normals в GPU вместо ЦП? раз так, как?
Благодаря фреймворку rootbeer возможно программирование на GPU для Java. Какой код Java следует использовать для rootbeer и какой код лучше запускать на виртуальной машине Java? Или другой :, код которого производит...
В C++ AMP функции ядра или лямбда-выражения помечены с помощью limit(amp), что налагает строгие ограничения на разрешенное подмножество C++ (перечислено здесь). Предоставляет ли CUDA больше свободы для подмножества C++...
Не секрет, что в CUDA 4.x первый вызов cudaMalloc может быть смехотворно медленным (, о чем сообщалось несколько раз ), по-видимому, ошибка в драйверах CUDA. Недавно я заметил странное поведение :в...
Я новичок в параллельном программировании. У меня есть вопрос, который может показаться глупым, но я не получил окончательного ответа, когда искал его в Google. В вычислениях на GPU есть устройство, то есть GPU и...
Я использую nsight 2.2, Toolkit 4.2, последнюю версию драйвера nvidia, Я использую пару графических процессоров на своем компьютере. Сборка по индивидуальному заказу 4.2. Я установил «генерировать вывод GPU» в свойствах проекта CUDA, монитор nsight ...
В моем приложении мне нужен расчет с двойной точностью. Согласно тому, что я нашел в Google, я должен добавить флаг «-arch sm _13» или «-arch sm _20». Q1 :В чем разница между "-arch sm _13" и "-arch...
Я ищу хороший API для реализации алгоритмов на графическом процессоре. Я бы предпочел что-то относительно простое и гибкое. Я ищу не самую хардкорную производительность, а что-то...