0
ответов

Необходимо ли оборудование CUDA во время компиляции?

Необходима ли установленная видеокарта с поддержкой CUDA (в Linux) для компиляции программ CUDA с nvcc? Или можно компилировать программы везде и запускать только на таких системах?
вопрос задан: 2 January 2012 17:12
0
ответов

Производительность целочисленных и побитовых операций на графическом процессоре

Хотя графические процессоры предназначены для использования с типами данных с плавающей запятой, мне было бы интересно узнать, насколько быстро графический процессор может обрабатывать побитовые операции. Это самые быстрые из возможных на CPU, но эмулиру
вопрос задан: 30 December 2011 22:36
0
ответов

Как рассчитать нагрузку на карту nvidia (с поддержкой cuda) и графическим процессором?

Я хочу знать, как отображать процент возможностей видеокарты при отправке задач на карту. Как системный монитор Gnome. Более того, как получить параметры устройства для расчета ...
вопрос задан: 7 December 2011 17:31
0
ответов

Какой прирост производительности дает GPU в matlab?

Я подумываю о том, чтобы попросить у своего начальника хороший GPU, чтобы выполнять вычисления с помощью пакета инструментов параллельной обработки matlab. Однако после нескольких простых тестов на компьютере коллеги, на NVidia Quadro ...
вопрос задан: 7 December 2011 16:37
0
ответов

CUDA Stream compaction: понимание концепции

Я использую CUDA / Thrust / CUDPP. Насколько я понимаю, при сжатии Stream определенные элементы в массиве помечаются как недопустимые, а затем «удаляются». Что на самом деле означает здесь «удаление»? Предположим, что ...
вопрос задан: 5 December 2011 16:01
0
ответов

При использовании более одного графического процессора в matlab

это результат работы ginfo с использованием Jacket / matlab: Обнаружены графические процессоры с поддержкой CUDA: Драйвер CUDA 270.81, набор инструментов CUDA 4.0 GPU0 Tesla C1060, 4096 МБ, Compute 1.3 (одинарный, двойной) (используется) GPU1 Tesla C1
вопрос задан: 5 December 2011 04:16
0
ответов

Выполнение кода C # на GPU

Я не знаком с концепциями программирования GPU и API. У меня есть несколько вопросов: Можно ли написать часть управляемого кода C # и скомпилировать / перевести его в какой-то модуль, который может быть ...
вопрос задан: 27 November 2011 21:16
0
ответов

Быстрая растеризация текста и векторной графики

Предположим, имеется много векторных фигур (кривые Безье, определяющие границу фигуры). Например, страница, полная крошечных букв. Как быстрее всего создать из него растровое изображение? Я однажды ...
вопрос задан: 22 November 2011 22:22
0
ответов

Аппаратное ускорение FFmpeg -> GPU + DirectShow

Существует ли версия FFmpeg с аппаратным ускорением (например, версия, в которой используется графический процессор)? Кроме того, кто-нибудь использует FFmpeg с поддержкой графического процессора? Возможно, для масштабирования и преобразования формата ви
вопрос задан: 18 November 2011 09:28
0
ответов

Стоит ли переносить вычисления FFT на встроенный графический процессор?

Мы рассматриваем возможность переноса приложения с выделенного чипа цифровой обработки сигналов на стандартное аппаратное обеспечение x86. Приложение делает много преобразований Фурье, и из краткого исследования, это ...
вопрос задан: 16 November 2011 21:02
0
ответов

Загрузка кода на GPU (Intel Sandy Bridge)

Мой вопрос не о GPGPU. Я достаточно хорошо понимаю GPGPU, и это не то, что я ищу. Предполагается, что у Intel Sand Bridge есть некоторые функции, которые позволяют напрямую выполнять ...
вопрос задан: 8 November 2011 20:46
0
ответов

Самый быстрый алгоритм триангуляции Делоне для GPU

Какой, по вашему мнению, самый быстрый алгоритм триангуляции Делоне для GPU? Или более общий, параллельно
вопрос задан: 26 October 2011 01:36
0
ответов

Запуск MSIL на GPU

Может быть, это безумный вопрос, но можно ли запускать потоки на GPU? Причина, по которой я спрашиваю, заключается в том, что мне нужно выполнить довольно сложные вычисления (в основном это математика и массивы), и я хотел бы посмотреть, смогу ли я ...
вопрос задан: 19 October 2011 15:05
0
ответов

Обобщенные вычисления в скользящем окне на GPU

Вот код Python, который реализует вычисление в скользящем окне для двух 3D-матриц, X и Y. import numpy def slide_dot (X , Y): assert X.ndim == Y.ndim == 3 iw, ih, id = X.shape ...
вопрос задан: 10 October 2011 02:43
0
ответов

Углубленный анализ разницы между ЦП и ГП [закрыто]

Я искал основные различия между ЦП и ГП, точнее тонкую линию, разделяющую ЦП и ГПУ. Например, почему бы не использовать несколько процессоров вместо одного графического процессора и так далее ...
вопрос задан: 7 October 2011 17:32
0
ответов

Самая быстрая библиотека обработки изображений [закрыто]

Мы разрабатываем систему, которая анализирует потоки высококачественных инфракрасных изображений для определения температуры с использованием диаграммы цветности. Может ли кто-нибудь предложить библиотеку обработки изображений, в которой используется ...
вопрос задан: 4 October 2011 18:49
0
ответов

Воксели… Честно говоря, мне нужно знать, с чего начать

Хорошо, я понимаю, что воксели - это просто объемная версия пиксель. После этого я даже не знаю, что искать. Поиск в Google не показывает никаких руководств, я не могу найти по нему книгу ...
вопрос задан: 4 October 2011 03:05
0
ответов

Использование графического процессора в Silverlight 5 для математических вычислений общего назначения

Я работаю над приложением Silverlight в браузере, которое выполняет некоторые довольно ресурсоемкие операции, например, выполнение обратного дискретного косинусного преобразования или быстрого преобразования Фурье. , сотни ...
вопрос задан: 29 September 2011 23:47
0
ответов

Возможности библиотечных функций в Mathematica

Я пытаюсь использовать CUSP как внешний линейный решатель для Mathematica, чтобы использовать возможности GPU. Вот веб-страница проекта CUSP. Я прошу подсказать, как мы можем интегрировать CUSP с ...
вопрос задан: 28 September 2011 12:41
0
ответов

OpenCL FFT lib for GPUs?

Is there any general FFT lib available for running on the GPU using OpenCL? As far as my knowledge goes, Apple sample code for power-of-two OpenCL FFT is the only such code available? Does any such ...
вопрос задан: 20 September 2011 15:21
0
ответов

Статистика кэш-памяти GPU L1 и L2

Я написал несколько простых бенчмарков, которые выполняют серию глобальных обращений к памяти. Когда я измерял статистику L1 и L2 кэш-памяти, я обнаружил, что (в GTX580, который имеет 16 SMs): всего L1 ....
вопрос задан: 19 September 2011 10:00
0
ответов

Программирование GPU?

Я новичок в мире программирования GPU, я пытался читать на Википедии и гугу, но у меня все еще есть несколько вопросов: я скачал некоторые примеры GPU, для CUDA, были некоторые .CU Файлы и некоторые ...
вопрос задан: 12 September 2011 20:42
0
ответов

Какова максимальная текстура «счетчик» для iPad / 3GS (видеокарта SGX)? Сколько памяти мы можем использовать «специально» для данных текстуры?

Что именно «совместное память», связанная с памятью текстуры в PowerVR SGX CARD. Нет правильной документации, связанной с этим. Обычно для приложения на iPhone (предполагают 3GS / iPad PowerVR SGX ...
вопрос задан: 9 September 2011 04:45
0
ответов

OpenCL - Как запросить ширину SIMD устройства?

В CUDA , существует концепция деформации, которая определяется как максимальное количество потоков, которые могут выполнять одну и ту же инструкцию одновременно в одном обрабатывающем элементе. Для NVIDIA эта деформация ...
вопрос задан: 18 August 2011 09:25
0
ответов

Минимальное количество потоков графического процессора, чтобы быть эффективным

Я собираюсь распараллелить на CUDA алгоритм локального поиска для решения некоторых задач оптимизации. Задача очень сложная, поэтому размер практически решаемых задач невелик. Меня беспокоит то, что ...
вопрос задан: 11 August 2011 17:12
0
ответов

Пиковая пропускная способность ядра cuda на графическом процессоре NVIDA

У меня есть вопрос о пропускной способности ядра, работающего на графическом процессоре. Предполагая, что его заполнение составляет 0,5, размер блока равен 256: в руководстве по программированию говорится, что лучше иметь много блоков, чтобы они могли .
вопрос задан: 6 August 2011 09:55
0
ответов

Predicția ramurii pe GPU

Am o întrebare despre predicarea ramurilor în GPU-uri. Din câte știu eu, în GPU-urile, ele predicează cu ramuri. De exemplu, am un cod ca acesta: if (C) A altfel B deci dacă A durează 40 de cicluri și ...
вопрос задан: 3 August 2011 15:38
0
ответов

Дизассемблировать ядро ​​OpenCL?

Я не уверен, возможно ли это. Я хочу глубоко изучить OpenCL, поэтому мне было интересно, есть ли инструмент для дизассемблирования скомпилированного ядра OpenCL. Для обычного исполняемого файла x86 я могу использовать objdump, чтобы получить ...
вопрос задан: 26 July 2011 13:33
0
ответов

Варианты промахов кеша в GPU

Я использовал ядро ​​OpenCL, которое обращается к 7 глобальным буферам памяти, делает что-то со значениями и сохраняет результат обратно в 8-й глобальный буфер памяти . Как я заметил, по мере увеличения размера ввода ...
вопрос задан: 19 July 2011 15:09
0
ответов

Синхронизация в графических процессорах

У меня есть некоторый вопрос о том, как графические процессоры выполняют синхронизацию. Насколько я знаю, когда деформация встречает барьер (при условии, что она находится в OpenCL), и она знает, что другие деформации той же группы не были…
вопрос задан: 13 July 2011 09:01