2
ответа

Примеры OpenCL со сравнительными тестами

Я ищу некоторые вводные примеры к OpenCL, которые иллюстрируют типы приложений, которые могут испытать большой (например, 50x-1000x) увеличения скорости. Cuda имеет много хороших примеров, но меня...
вопрос задан: 14 September 2009 22:41
2
ответа

Выделите 2D массив на памяти устройства в CUDA

Как я выделяю и передаю (и от Хоста) 2D массивы в памяти устройства в Cuda?
вопрос задан: 26 June 2009 04:38
2
ответа

При использовании ISerializable с DataContractSerializer, как я мешаю сериализатору произвести информацию о типе?

Для получения большего количества контроля над сериализацией я преобразовал класс от [DataContract] до [сериализуемого], реализовав и GetObjectData и специального конструктора десериализации. Когда я делаю это...
вопрос задан: 2 April 2009 06:26
2
ответа

CUDA для .NET?

Я знаю, что существует много привязок к языку CUDA, таких как PyCUDA, но является там какой-либо хорошей привязкой для .NET? Единственный, который я видел, является этим, но я хотел бы знать, существуют ли какие-либо другие.
вопрос задан: 30 January 2009 12:24
2
ответа

Динамическое Выделение Постоянной памяти в CUDA

Я пытаюсь использовать в своих интересах постоянную память, но мне нелегко выяснять, как вложить массивы. То, что я имею, является массивом данных, которые имеют счета для внутренних данных, но это...
вопрос задан: 7 November 2008 05:03
2
ответа

Как я делаю уже записанный параллельный прогон программы на массиве GPU?

Мне записали нейронную сеть в Erlang, и я просто купил карту GeForce GTX 260 с 240 базовыми GPU на нем. Действительно ли это тривиально для использования CUDA в качестве связующего звена для выполнения этого на видеокарте?
вопрос задан: 19 October 2008 10:40
1
ответ

Версия драйвера CUDA недостаточна для версии среды выполнения CUDA

Я получил сообщение: "cutilCheckMsg () ошибка CUTIL CUDA: отказ запуска ядра: версия драйвера CUDA недостаточна для версии среды выполнения CUDA". При попытке выполнить исходный код в качестве примера. Также...
вопрос задан: 23 June 2019 17:10
1
ответ

Компилятор Cuda NVCC - как включить / показать?

Мне нужно показать все включения (в порядке их включения) в окне «Вывод» Visual Studio, чтобы выяснить, какой файл вызвал какую-то неясную ошибку. Но не могу найти способ включить "/ ...
вопрос задан: 4 April 2019 23:04
1
ответ

Tensorflow / NVIDIA / CUDA докер несовместимые версии

Я пытаюсь использовать tenorflow и nvidia с докером, но появляется следующая ошибка: docker run --runtime = nvidia -it --rm tenorflow / tenorflow: latest-gpu python -c "импортировать тензор потока как tf; ...
вопрос задан: 28 March 2019 03:20
1
ответ

Есть ли способ запуска кодов CUDA на компьютере, на котором нет графического процессора NVIDIA (мой компьютер оснащен встроенной графической картой Intel)? [Дубликат]

Я ищу способ запуска программ CUDA в системе без графического процессора NVIDIA. Я пытался установить MCUDA и gpuOcelot, но, похоже, возникли некоторые проблемы с установкой. Я прошел через ...
вопрос задан: 24 March 2019 06:07
1
ответ

Проблемы с 2D массивом CUDA

В настоящее время я пытаюсь правильно работать с 2D-массивами в моем ядре CUDA. 1D был в порядке, но до сих пор не повезло с переходом на 2D. Вот моя функция хоста и ядро: __global__ void ...
вопрос задан: 17 March 2019 22:10
1
ответ

Компиляция CUDA-кода в статическую библиотеку (.a) в Linux

Я пытаюсь скомпилировать небольшую библиотеку, содержащую код CUDA. Я успешно скомпилировал его как общую библиотеку, но на самом деле мне нужна статическая библиотека. У меня есть два исходных файла: main.c: содержащий ...
вопрос задан: 5 March 2019 15:41
1
ответ

Почему я получаю предупреждение, когда использую рекурсию в CUDA?

Я должен решить проблему с кодом на GPU, используя CUDA, но я всегда получаю предупреждение о размере стека, поскольку «имя функции» не может быть определено статически. Это для студенческого проекта, который я ...
вопрос задан: 31 January 2019 14:12
1
ответ

Правильное время выполнения программы CUDA

Я написал небольшую программу, с помощью которой вы можете получить границы цифрового изображения (известный детектор Canny). Необходимо измерить точное время (в миллисекундах) выполнения алгоритма на ...
вопрос задан: 23 January 2019 08:17
1
ответ

Как создать неглубокую копию тяги device_vector

У меня есть device_vector H. Я хочу создать поверхностную копию H, используя выбранные индексы. Я называю это J. Я хочу изменить элементы J, тем самым модифицируя соответствующие элементы H. Моя попытка ниже ...
вопрос задан: 19 January 2019 07:23
1
ответ

Комплексное сокращение числа с помощью numba cuda

Я пытаюсь ускорить код Python с помощью cuda \ numba. Код работает с большими массивами комплексных, чисел с плавающей точкой и целых чисел. Я включил и версию Python, и версию Numba-Cuda здесь. ...
вопрос задан: 19 January 2019 00:16
1
ответ

Cuda Kernel-эквивалент ядра Metal Compute

У меня есть простое металлическое вычислительное ядро, которое я пытаюсь сделать эквивалентом Cuda. Источник ядра Metal - это #include < metal_stdlib > использование пространства имен металла; постоянный шаг мяты [[...
вопрос задан: 18 January 2019 23:09
1
ответ

Ошибка связывания при разделении функции CUDA на объявление и определение

Я следую инструкциям в блоге NVidia о том, как разделить функции, вызываемые из ядра, на объявление и определение. Используя версию CUDA 10 и компилятор Visual Studio производит ...
вопрос задан: 18 January 2019 09:36
1
ответ

Как передать объект класса в ядро ​​CUDA

Я пытаюсь передать объект класса от хоста к ядру устройства CUDA. Я получаю некоторую ошибку, такую ​​как Ошибка шины: 10. Пожалуйста, помогите, как передать объект класса, который содержит массив Вот мой код matrixCU.h # ...
вопрос задан: 16 January 2019 12:03
1
ответ

Звоните многократно get_global_id () по сравнению с сохранением результат в локальной переменной?

Это - вероятно, глупый вопрос, но: Как дорогой это должно вызвать некоторую get_* функцию в OpenCL-ядрах? Лучше сохранить результат для будущего использования в некоторой локальной переменной или назвать желаемое...
вопрос задан: 19 December 2018 08:00
1
ответ

Как рассматривать 64-разрядные слова на устройстве CUDA?

Я хотел бы обработать непосредственно 64-разрядные слова на платформе CUDA (например, uint64_t Вар). Я понимаю, однако, что адресуемое пространство, регистры и архитектура SP все 32-разрядные базирующийся. Я на самом деле...
вопрос задан: 19 December 2018 07:10
1
ответ

Эксклюзивный вычисляют режим с OpenCL+NVidia

У меня есть вопрос эксклюзивному, вычисляют режим с NVidia+OpenCL. Я могу настроить эксклюзивный, вычисляют режим (страница 74 из cuda руководства по программированию 3.0) с nvidia-smi на nvidia-gpu. это означает, только один...
вопрос задан: 19 December 2018 07:06
1
ответ

Параллеллизация C ++ fprintf с несколькими выводами с использованием push.gif :: copy и ostream_iterator

Я новичок в программировании CUDA и GPU. Я пытаюсь распараллелить следующую функцию C ++ для наших биологических научных вычислений: void superposeFitStructure (string filename, ...
вопрос задан: 14 July 2018 02:23
1
ответ

динамическое распределение стека на устройстве с помощью cuda

Название говорит все. Есть ли что-то подобное функции alloca () в cuda, но для стороны устройства? Мне нужно выделить малые массивы (nxn и nx1, с n & lt; = 10), n - динамическая переменная. ...
вопрос задан: 13 July 2018 14:46
1
ответ

об адресе автоматического массива CUDA

Я новичок в CUDA и GPU, и я пытаюсь понять, как все работает, особенно в том, как выкладывается память. Следующий фрагмент кода: #include & lt; stdio.h & gt; __global__ void addr (long ...
вопрос задан: 13 July 2018 12:06
1
ответ

Первый параметр в инструкции shuffle war в описании CUDA 9 [дубликат]

С CUDA 9 у нас есть новая версия функции перетасовки warp, и они устарели предыдущие. Но первый параметр для этих функций, называемый «маска», и я не могу просто найти какие-либо подробности ...
вопрос задан: 1 June 2018 08:30
1
ответ

Команда top для графического процессора с использованием CUDA

Я пытаюсь контролировать процесс, использующий cuda и MPI, могу ли я это сделать, что-то вроде команды «top», но которая также контролирует графический процессор?
вопрос задан: 9 June 2017 09:26
1
ответ

Максимальное количество потоков в CUDA?

Существует ли максимальное количество потоков, которое можно создать в CUDA? Для пояснения я имею в виду потоки CUDA как в потоке, который позволяет выполнять ядра и операции с памятью.
вопрос задан: 25 May 2017 10:24
1
ответ

Как интегрироваться, CUDA .cu кодируют с приложением C++

Это сообщение тесно напоминает мое более раннее сообщение: Как разделить код CUDA на несколько файлов, я боюсь, что сделал такую грубую ошибку того, что я на самом деле просил, чтобы это слишком сбивало с толку для попытки...
вопрос задан: 23 May 2017 10:34
1
ответ

Как я могу перебирать 2D-массив структур и применять преобразования в CUDA Thrust? [Дубликат]

Я только начал изучать CUDA и библиотеку Thrust. Мне очень трудно парализовать следующую функцию C ++: void assignAlignedResiduePairs (vector & lt; Atom * & gt; vStruct1, vector & ...
вопрос задан: 24 April 2017 09:49