0
ответов

CUDA ускорение для простых расчетов

У меня есть следующий код в cuda_computation.cu #include #include #include #include void checkCUDAError (const char * msg); ...
вопрос задан: 23 May 2012 07:04
0
ответов

Текстура Основы memory-tex2D

При использовании памяти текстур я столкнулся со следующим кодом: uint f = (blockIdx.x * blockDim.x) + threadIdx.x; uint c = (blockIdx.y * blockDim.y) + threadIdx.y; uint read = tex2D( refTex, c+0....
вопрос задан: 18 May 2012 02:26
0
ответов

Как найти константы epsilon, min и max для CUDA?

Я ищу значения epsilon (наименьший шаг между двумя числами), min (наименьшая величина) и max (наибольшая величина) для устройств CUDA. Т.е. эквиваленты FLT_EPSILON (...
вопрос задан: 16 May 2012 12:49
0
ответов

CUDA/openCL; переписывание ветвей как выражение без ветвления

В большинстве случаев ветвь требуется в программе CUDA или OpenCL, например: for (int i=0; i
вопрос задан: 15 May 2012 21:53
0
ответов

Инициализировать массив устройств в CUDA

Как инициализировать массив устройств, выделенный с помощью cudaMalloc()? Я попробовал cudaMemset, но он не может инициализировать все значения, кроме 0.code, потому что cudaMemset выглядит так, как показано ниже, где значение равно ...
вопрос задан: 15 May 2012 08:34
0
ответов

Можно ли использовать быструю очередь в памяти, которая меняет местами элементы при достижении определенного размера?

Я использую c/c++/cuda менее недели и не знаком со всеми вариантами, доступными с точки зрения библиотек (извините, если мой вопрос слишком дурацкий или неразрешимый). Вот моя проблема, у меня есть ...
вопрос задан: 12 May 2012 23:40
0
ответов

О функции голосования деформации

Руководство по программированию CUDA представило концепцию функции голосования деформации, "_all", "_any" и "__ballot". У меня вопрос: какие приложения будут использовать эти 3 функции?
вопрос задан: 11 May 2012 19:10
0
ответов

Простое добавление двух целых чисел в Cuda, результат всегда один и тот же

Я начинаю изучать Куда.Я играю с каким-то кодом cuda типа hello world, но он не работает, и я не уверен, почему. Код очень простой, возьмите два int и добавьте их на GPU и...
вопрос задан: 10 May 2012 01:13
0
ответов

Есть ли IDE, которая работает с CUDA на mac osx lion?

Я пытаюсь изучить Cuda, и это очень интересно, но у меня возникают проблемы с созданием кода без помощи IDE. Я знаю Java/Python, но не знаком с C/C++, поэтому я использую ...
вопрос задан: 9 May 2012 00:42
0
ответов

API драйвера CUDA и изменение функций

У меня есть проект, для которого требуется C++11, поэтому я разделяю файлы на две категории: те, которые используют C++11, и те, которые используют C++03 и, следовательно, совместимы с компилятором nvcc. Когда у меня есть ядро...
вопрос задан: 3 May 2012 17:14
0
ответов

в чем разница между «-arch sm _13» и «-arch sm _20»

В моем приложении мне нужен расчет с двойной точностью. Согласно тому, что я нашел в Google, я должен добавить флаг «-arch sm _13» или «-arch sm _20». Q1 :В чем разница между "-arch sm _13" и "-arch...
вопрос задан: 3 May 2012 07:21
0
ответов

Как создать контекст CUDA?

Как создать контекст CUDA? Первый вызов CUDA медленный, и я хочу создать контекст перед запуском ядра.
вопрос задан: 2 May 2012 14:03
0
ответов

CUDA объединил доступ к глобальной памяти

Я прочитал руководство по программированию CUDA, но пропустил одну вещь. Допустим, у меня есть массив 32-битных целых чисел в глобальной памяти, и я хочу скопировать его в общую память с объединенным доступом. Глобальный массив имеет...
вопрос задан: 2 May 2012 11:12
0
ответов

Использование std ::vector в коде устройства CUDA

Вопрос в том, :есть ли способ использовать класс vector в ядрах Cuda? Когда я пытаюсь, я получаю следующую ошибку :ошибка :вызов функции хоста ("std ::vector &...
вопрос задан: 30 April 2012 08:51
0
ответов

ctags+taglist для.cu (CUDA )файлы

Я использую редактор vim (в Ubuntu ). Недавно я работал с большими проектами cuda и поэтому хотел бы использовать утилиту ctags для просмотра кода. Список поддерживаемых языков для...
вопрос задан: 25 April 2012 10:26
0
ответов

Странная ошибка при использовании cudaMemcpy: cudaErrorLaunchFailure

У меня есть код CUDA, который работает следующим образом: cpyDataGPU --> CPU while(nsteps){ cudaKernel1<<<,>> > функция1(); cudaKernel2<<<,>>> } ...
вопрос задан: 24 April 2012 20:43
0
ответов

Путаница с CUDA/openCL и C++ AMP

Я читал, что Microsoft тесно сотрудничает с Nvidia над улучшением производительности AMP. Но мой вопрос: :является ли AMP CUDA -заменой Microsoft? Или AMP использует драйверы CUDA, когда видеокарта NVIDIA CUDA...
вопрос задан: 24 April 2012 17:58
0
ответов

Расхождение потоков Openmp?

Термин расхождение потоков используется в CUDA; насколько я понимаю, это ситуация, когда разные потоки назначаются для выполнения разных задач, и это приводит к большому снижению производительности. Я был...
вопрос задан: 20 April 2012 16:16
0
ответов

Программирование CUDA -Кэш L1 и L2

Не могли бы вы объяснить разницу между использованием кеша L1 и L2 или кеша только L2 в программировании CUDA? Что я должен ожидать в срок исполнения? Когда я могу ожидать меньшего времени GPU?...
вопрос задан: 16 April 2012 20:10
0
ответов

2D-свертка малого ядра CUDA — как это сделать

Я несколько дней экспериментировал с ядрами CUDA, чтобы выполнить быстрая 2D-свертка между изображением 500x500 (но я мог бы также варьировать размеры) и очень маленьким 2D-ядром (ядро 2D-лапласиана, так что...
вопрос задан: 13 April 2012 17:25
0
ответов

Как изменить имя выходного файла cuda_compile_ptx в CMake?

В CMAKE с FindCUDA при наличии входного файла filename.cu команда cuda_compile_ptx генерирует имена выходных файлов вида cuda_compile_ptx_generated_filename.cu.ptx, но мне нужны выходные имена файлов...
вопрос задан: 13 April 2012 06:20
0
ответов

Могут ли утилиты python distutils компилировать код CUDA?

У меня есть код CUDA, из которого я хочу создать динамическую библиотеку для Python с помощью distutils. Но похоже, что distutils не распознает файл «.cu», даже если установлен компилятор «nvcc». Не знаю, как его получить...
вопрос задан: 5 April 2012 19:05
0
ответов

CUDA: Почему иногда используются побитовые операторы быстрее, чем логические операторы?

Когда я пытаюсь выжать из ядра последние биты производительности, я обычно обнаруживаю, что замена логических операторов (&& и ||) побитовыми операторами (& и |) делает ядро...
вопрос задан: 28 March 2012 11:42
0
ответов

Сообщение об ошибке CUDA: неопределенный сбой запуска

Это часть моего кода CUDA. Но последняя часть этого кода говорит о каком-то сообщении об ошибке. целое число без знака *mat_count; off_t *mat_position; целое число без знака *matches_count; off_t *matches_position; ...... cudaMalloc ...
вопрос задан: 28 March 2012 07:04
0
ответов

Объяснение CUDA C и C++

Может ли кто-нибудь дать мне хорошее объяснение природы CUDA C и C++? Насколько я понимаю, CUDA должен быть C с библиотеками графического процессора NVIDIA. На данный момент CUDA C поддерживает некоторые функции C++...
вопрос задан: 23 March 2012 21:10
0
ответов

Плохая производительность при вычислении собственных значений и векторов на графическом процессоре.

В некотором коде нам нужно получить авто-векторы и авто-значения для обобщенной проблемы собственных значений с симметричными действительными матрицами (Ax=lamba Bx). Этот код использует DSPGVX от LACPACK. Мы хотели ускорить его...
вопрос задан: 18 March 2012 23:51
0
ответов

Ошибка CUDA 4.1 printf()

Несмотря на то, что у меня есть карта fermi (gtx 560), я получаю эту ошибку на VS2010: ошибка: вызов функции хоста ("printf" ) из функции __device__/__global__ ("ядро") не разрешено Код: #include "...
вопрос задан: 17 March 2012 11:33
0
ответов

Отслеживание использования регистров ядра cuda

Я пытаюсь отследить использование регистров и наткнулся на интересный сценарий. Рассмотрим следующий источник: #define OL 20 #define NHS 10 __global__ void loop_test( float ** out, const float ** ...
вопрос задан: 15 March 2012 15:56
0
ответов

Как уменьшить каждый элемент device_vector на константу?

Я пытаюсь использовать Thrust::transform для уменьшения постоянного значения из каждого элемента device_vector. Как видите, последняя строка неполная. Я пытаюсь уменьшить из всех элементов ...
вопрос задан: 13 March 2012 02:05
0
ответов

/usr/bin/ld: не удается найти -lcudart

Я получаю следующее сообщение при попытке скомпилировать программу CUDA: /usr/bin /ld: не удается найти -lcudart Никогда раньше не сталкивался с такой ошибкой. Это какая-то проблема с моим PATH? Вот ...
вопрос задан: 12 March 2012 12:45