9
ответов

Вы успешно использовали GPGPU? [закрытый]

Мне интересно знать, записал ли кто-либо приложение, которое использует в своих интересах GPGPU при помощи, например, Nvidia CUDA. Если так, что сделали проблемы Вы находите и что сделало увеличение производительности...
вопрос задан: 18 February 2015 17:21
7
ответов

Выполнимость GPU как ЦП? [закрытый]

Что Вы думаете будущее GPU как ЦП, который инициативы как CUDA? Вы думаете, что они собираются стать господствующей тенденцией и следующим быть принятым популярным товаром в промышленности? Apple создает новую платформу...
вопрос задан: 9 December 2014 02:16
7
ответов

Использование GPU с c # [закрыто]

Я пытаюсь получить больше вычислительной мощности из моей сетки. Я использую все процессоры / ядра, возможно ли использовать графический процессор с C #. Кто-нибудь знает какие-либо библиотеки или получил пример кода?
вопрос задан: 17 November 2012 10:49
6
ответов

Финансовые приложения на GPGPU

Я хочу знать, какие финансовые приложения могут быть реализованы с помощью GPGPU. Я знаю об Опции оценка Курса акций pricing/с помощью моделирования Монте-Карло на GPGPU, использующем CUDA. Может кто-то...
вопрос задан: 11 May 2010 05:48
6
ответов

Как хорошо общие задачи программирования переводят в GPU?

Я недавно начал работать над проектом установить, как лучше всего усилить вычислительную мощность, доступную в современных видеокартах для общего программирования. Кажется что цель защитника...
вопрос задан: 4 October 2008 17:02
5
ответов

Время ожидания приложений CUDA & amp; потерпеть неудачу через несколько секунд - как обойти это?

Я заметил, что приложения CUDA обычно имеют приблизительное максимальное время выполнения 5-15 секунд, прежде чем они выйдут из строя и выйдут. Я понимаю, что идеально, чтобы приложение CUDA не запускалось так долго, но ...
вопрос задан: 2 December 2013 07:13
5
ответов

Какова самая тривиальная функция, которая была бы benfit от того, чтобы быть вычисленным на GPU?

Я только начинаю изучать OpenCL. Я пытаюсь получить ощущение какой увеличение производительности ожидать когда движущиеся функции/алгоритмы к GPU. Наиболее простое ядро, данное в большинстве учебных руководств...
вопрос задан: 1 September 2013 05:59
5
ответов

Операции на типах произвольного значения

Эта статья описывает способ, в C#, позволить добавление типов произвольного значения, которые имеют + оператор, определенный для них. В сущности это позволяет следующий код: общественность T Добавляет (T val1, T val2) {...
вопрос задан: 27 February 2010 03:51
4
ответа

API драйвера CUDA и среда выполнения CUDA

При написании приложений CUDA вы можете работать на уровне драйвера или на уровне среды выполнения, как показано на этом образе (библиотеки CUFFT и CUBLAS для углубленной математики): (источник: tomshw.it) ...
вопрос задан: 20 February 2019 05:02
4
ответа

Сокращение количества регистров, используемых в ядре CUDA

У меня есть ядро, которое использует 17 регистров, уменьшение его к 16 принесло бы мне 100%-е заполнение. Мой вопрос: есть ли методы, которые могут использоваться для сокращения количества или используемых регистров, исключая...
вопрос задан: 12 July 2012 19:12
4
ответа

математика высокой точности на GPU

Я интересуюсь реализацией алгоритма на GPU с помощью HLSL, но одна из моих основных проблем - то, что я хотел бы переменный уровень точности. Есть ли методы там для эмуляции 64 битов...
вопрос задан: 18 September 2009 16:42
4
ответа

Как получить OpenCL SDK?

Я просматривал веб-сайт http://www.khronos.org/ и только нашел заголовки для OpenCL (не OpenGL, о котором я не забочусь о). Как я могу получить OpenCL SDK?
вопрос задан: 7 September 2009 19:15
3
ответа

Самый быстрый вид массива интервала фиксированной длины 6

При ответе на другой вопрос о Переполнении стека (этот) я наткнулся на интересную подпроблему. Что самый быстрый путь состоит в том, чтобы отсортировать массив 6 целых чисел? Поскольку вопросом является очень низкий уровень: мы можем'...
вопрос задан: 8 April 2019 18:32
3
ответа

Плавающая точка двойной точности в CUDA

CUDA поддерживает числа двойной точности с плавающей точкой? Кроме того, каковы причины того же?
вопрос задан: 17 November 2017 23:30
3
ответа

Есть ли эффективный способ уплотнения разреженного массива в OpenCL / CUDA? [Дубликат]

Проблема. Предположим, у меня есть большой массив в глобальной памяти, заполненный в основном 0s, но с некоторыми элементами (25%), являющимися числами: [9, 0, 0, 0, 7, 0, 0, 3, 0, 0, 0, 0, 5, 0, 0, 0, 8, 0, 2, 0, 0, 4, 0, 0, ...
вопрос задан: 7 February 2017 09:14
3
ответа

CUDA Nvidia использования библиотеки Compression [закрывается]

Кто-либо знает проект, который реализует стандартные методы сжатия (как Zip, GZip, BZip2, LZMA...) пользование библиотекой CUDA NVIDIA? Я задавался вопросом, если алгоритмы, которые могут использовать много из...
вопрос задан: 26 January 2017 10:42
3
ответа

Как очень простой Make-файл должен быть похожим для компиляции Cuda в соответствии с Linux

Я хочу скомпилировать очень простое привет мировой уровень программа Cuda в соответствии с Linux. У меня есть три файла: ядро: основной метод helloWorld.cu: helloWorld.cpp общий заголовок: helloWorld.h Мог Вы писать мне...
вопрос задан: 12 October 2011 11:54
3
ответа

Лучший подход для GPGPU/CUDA/OpenCL в Java?

Вычисления общего назначения на графических процессорах (GPGPU) являются очень привлекательным понятием для использования силы GPU для любого вида вычислений. Я хотел бы использовать GPGPU для обработки изображений...
вопрос задан: 13 April 2010 21:53
3
ответа

Быстрая сортировка в GLSL?

Я рассматриваю портирование большого блока обработки к GPU с помощью программы построения теней GLSL. Одна из непосредственных проблем, через которые я споткнулся, - то, что на одном из шагов, алгоритм должен вести список...
вопрос задан: 26 April 2009 07:49
2
ответа

переменные cudamalloc vs __device__ [duplicate]

Мой вопрос в чем разница между переменными, использующими переменные cudaMalloc и глобальные переменные __device__? Я хочу знать, есть ли разница в: производительности, как распределяется память для ...
вопрос задан: 30 October 2013 03:17
2
ответа

Почему я получаю CL_MEM_OBJECT_ALLOCATION_FAILURE?

Я выделяю буфер cl_mem на GPU и работу над ним, которая хорошо работает, пока определенный размер не превышен. В этом случае само выделение успешно выполняется, но выполнение или копирование не делают. Я действительно хочу...
вопрос задан: 12 April 2013 12:06
2
ответа

Используя Delphi для использования в своих интересах технологии GPGPU?

GPGPU является принципом использования параллельных процессоров на видеокартах для крупных увеличений производительности. У кого-либо есть какие-либо идеи об использовании GPGPU в Delphi, с помощью или OpenCL или CUDA? CUDA...
вопрос задан: 29 July 2010 13:07
2
ответа

Глобальный Размер Работы должен быть Несколькими из Размера Рабочей группы в OpenCL?

Здравствуйте: Действительно ли глобальная Работа измеряет (Размеры) Потребность быть Несколькими из Размера Рабочей группы (Размеры) в OpenCL? Если так, есть ли стандартный способ обработать матрицы не несколько из рабочей группы...
вопрос задан: 30 June 2010 09:24
2
ответа

CUDA, OpenCL, PGI, и т.д. …, но что произошло с GLSL и Cg?

CUDA, OpenCL и опции GPU, предлагаемые Portland Group, интригуют... Результаты являются впечатляющими (ускорение с 125 временами для некоторых групп). Это кажется, что следующая волна инструментов GPGPU готова...
вопрос задан: 11 June 2009 18:48
1
ответ

OpenCL VS Performance OpenMP [Закрыто]

Есть ли какие-либо исследования, сравнивающие OPENCL для производительности OpenMP? В частности, я заинтересован в накладных расходов запуска потоков с Opencl, например, если кто-то должен был разложить домен в ...
вопрос задан: 31 July 2017 14:57
1
ответ

CUDA модель - что такое размер деформации?

Какова взаимосвязь между максимальным размером рабочей группы и размером деформации? Допустим, мое устройство имеет 240 потоковых процессоров CUDA (SP) и возвращает следующую информацию - CL_DEVICE_MAX_COMPUTE_UNITS: ...
вопрос задан: 27 August 2015 18:39
1
ответ

Выполнение readback от структур Direct3D и поверхностей

Я должен выяснить, как получить данные из структур D3D и появляюсь назад к системной памяти. Что самый быстрый путь состоит в том, чтобы сделать такие вещи и как? Также, если мне только нужен один subrect, как можно читать...
вопрос задан: 19 June 2014 23:17
1
ответ

Есть ли алгоритм для сортировки массива строк для GPU?

Массив к виду имеет приблизительно один миллион строк, где каждая строка может иметь длину до одного миллиона символов. Я ищу любую реализацию сортировки алгоритма для GPU. У меня есть блок...
вопрос задан: 15 July 2010 13:17
1
ответ

Выполнение OpenCL на аппаратных средствах от смешанных поставщиков

Я играл с реализацией ATI OpenCL в их Потоке 2,0 беты. OpenCL в текущей бете только использует ЦП на данный момент, следующая версия, как предполагается, поддерживает ядра GPU. Я...
вопрос задан: 7 September 2009 09:11
0
ответов

Несколько экземпляров GPUComputationRenderer

У меня есть несколько экземпляров GPUComputationRenderer. Я не использую их одновременно. Я обновляю один, затем обновляю другой. Почему-то кажется, что они влияют друг на друга. У меня нет ...
вопрос задан: 30 December 2018 22:50