0
ответов

Как правильно обрабатывать закадровый EGLContext в Linux при выполнении масштабной задачи рендеринга?

Вот моя ситуация, я работаю над механизмом рендеринга видео, который работает на облачных серверах GPU с 64-битной ОС Ubuntu 16.04. Движок слушает запросы пользователей, когда он получает запрос на рендеринг, он ...
вопрос задан: 16 January 2019 15:11
0
ответов

Ошибка конфигурации Cuda: не удается найти библиотеку cuda libcublas.so.9.2

Используя виртуальную машину Linux Ubuntu 17.10, я пытаюсь создать shadoworflow с поддержкой GPU. Я установил Cuda 9.2, cuDNN 7.1.4 и NCCL 2.2.13 и использую следующую команду bazel для сборки ...
вопрос задан: 13 July 2018 16:10
0
ответов

Тензорный поток не использует программу gpu - простых чисел

Я установил tenorflow-gpu в своем ноутбуке (GTX 1060-6GB), и я разрабатываю программу генератора простых чисел с использованием функции tensorflow. Ниже приведен пример кода, который я использую для вычисления простых чисел: def ...
вопрос задан: 13 July 2018 05:50
0
ответов

Где я могу найти журнал, созданный из стека вызовов gpusGenerateCrashLog?

В моем движке рендеринга OpenGL я в настоящее время вырываю 1 кадр после нажатия клавиши, которая начинает выдавать новые вызовы OpenGL. Ниже приведен аварийный стек вызовов, являющийся потоком CVDisplayLink. ...
вопрос задан: 5 October 2017 22:49
0
ответов

Имеет ли смысл запускать на уровне ядра ОС вычисления на графическом процессоре?

Я заметил, что графический процессор может иметь сотни ядер, так что параллельные вычисления можно значительно ускорить с их помощью. Похоже, что в ядре ОС для ускорения не используются параллельные алгоритмы. Люди делают ...
вопрос задан: 19 September 2017 17:44
0
ответов

Как отключить Macbook Pro от переключения на высокопроизводительную видеокарту в Cocoa?

Все Macbook Pro 2010 года поставляются с двумя видеокартами - низкопроизводительной встроенной Intel HD и высокопроизводительной дискретной видеокартой NVIDIA - и переключается между ними на лету, в зависимости от потребностей ...
вопрос задан: 6 September 2017 14:50
0
ответов

Возможно ли использовать GPU-ускорение при компиляции нескольких программ на компиляторе gcc?

Есть ли способ или инструмент для применения GPU-ускорения при компиляции программ на компиляторе GCC? Сейчас я создал программу для итеративной компиляции заданного списка программ. Это занимает несколько минут....
вопрос задан: 28 July 2017 15:39
0
ответов

CUDA текстуры кубических карт

Как работать с текстурами карт кубов OpenGL в CUDA? Когда кто-то хочет использовать текстуры OpenGL в ядре CUDA, одна из вещей, которую нужно сделать, - это извлечь массив CUDA из зарегистрированного изображения и сопоставленного ресурса ...
вопрос задан: 4 June 2017 05:20
0
ответов

Как выбрать размеры сетки и блока для ядер CUDA?

Это вопрос о том, как определить размер сетки, блока и потока CUDA. Это дополнительный вопрос к опубликованному здесь: https://stackoverflow.com/a/5643838/1292251 После этого...
вопрос задан: 23 May 2017 10:31
0
ответов

Насколько хороша библиотека графического процессора OpenCV для матричных операций?

Я использую OpenCV для приложения в области компьютерного зрения. Я хотел бы ускорить некоторые операции с матрицами, (матрицы довольно большие )на графическом процессоре, и хочу по возможности избежать кодирования непосредственно в CUDA C....
вопрос задан: 23 May 2017 10:30
0
ответов

סאָרטינג 3 ערייז דורך שליסל אין קודאַ (ניצן שטויס טאָמער)

איך האָבן 3 ערייז פון די זעלבע גרייס (מער ווי 300.000 עלעמענטן). איין מענגע פון ​​לאָזנ שווימען נומערן און צוויי ערייזאַז פון ינדאַסיז. אַזוי, פֿאַר יעדער נומער איך האָבן 2 ידס. אַלע די 3 ערייז זענען שוין אין גפּו גלאבאלע ...
вопрос задан: 27 February 2017 11:33
0
ответов

Могу ли я запустить CUDA на встроенном графическом процессоре Intel?

У меня очень простой ноутбук Toshiba с процессором i3. Кроме того, у меня нет дорогой видеокарты. В настройках дисплея я вижу Intel (HD) Graphics как адаптер дисплея. Планирую изучить ...
вопрос задан: 16 February 2017 18:00
0
ответов

Контролируйте использование Видеокарты

Как я могу контролировать, сколько из видеокарты используется, когда я запускаю определенное приложение? Я хочу видеть, насколько мое приложение использует GPU.
вопрос задан: 21 January 2017 19:55
0
ответов

Выбор между GeForce или Quadro GPU для машинного обучения через TensorFlow

Есть ли заметная разница в производительности TensorFlow при использовании графических процессоров Quadro и GeForce? например он использует операции с двойной точностью или что-то еще, что может вызвать падение GeForce ...
вопрос задан: 30 November 2016 14:20
0
ответов

Как планировщики деформации графического процессора nVIDIA CC 2.1 выдают две инструкции одновременно для деформации?

Примечание. Этот вопрос касается устройств nVIDIA Compute Capability 2.1. Следующая информация получена из Руководства по программированию CUDA v4.1: В устройствах с вычислительными возможностями 2.1 каждый SM имеет ...
вопрос задан: 9 November 2016 09:30
0
ответов

Зачем вообще знать о CUDA Warps?

У меня GeForce GTX460 SE, так что это :6 SM x 48 ядер CUDA = 288 ядер CUDA. Известно, что в одном Warp содержится 32 потока, и что в одном блоке одновременно (за раз )может выполняться только один...
вопрос задан: 9 November 2016 09:18
0
ответов

Очистка памяти графического процессора Tensorflow после выполнения модели

Я обучил 3 модели и сейчас выполняю код, который последовательно загружает каждую из 3 контрольных точек и выполняет прогнозы, используя их. Я использую графический процессор. Когда первая модель загружена, она предварительно выделяет ...
вопрос задан: 28 September 2016 21:38
0
ответов

Сохранение кэша L1 в ядрах CUDA

Я понимаю, что общая память на GPU не сохраняется в разных ядрах. Однако сохраняется ли кеш L1 при разных вызовах ядра?
вопрос задан: 24 August 2016 14:07
0
ответов

Заголовок местоположения PHP Игнорировать хэш [дубликат]

Возможно дублирование: фрагмент URL и 302 перенаправляет я интегрирую вход Facebook в мой сайт. Когда Facebook перенаправляет на мой сайт с параметром запроса кода, в конце http:...
вопрос задан: 30 May 2016 05:34
0
ответов

Когда вызывать cudaDeviceSynchronize?

когда действительно необходим вызов функции cudaDeviceSynchronize?. Насколько я понял из документации CUDA, ядра CUDA асинхронны, поэтому кажется, что нам следует вызывать...
вопрос задан: 16 May 2016 10:15
0
ответов

​​Размер разделяемой памяти GPU очень мал - что я могу с этим поделать?

Размер разделяемой памяти («локальная память» в терминах OpenCL) составляет всего 16 Кбайт на большинстве современных графических процессоров NVIDIA. У меня есть приложение, в котором мне нужно создать массив из 10 000 целых чисел. так что ...
вопрос задан: 4 May 2016 17:40
0
ответов

Как преобразовать GpuMat в CvMat в OpenCV?

Я знаю, как сделать наоборот, т.е. получить GpuMat из CvMat с помощью загрузки, но мне нужен CvMat из GpuMat, есть ли любой метод, который можно использовать для этого?
вопрос задан: 15 April 2016 02:11
0
ответов

Самая быстрая реализация SVM, которую можно использовать в Python

Я создаю некоторые модели прогнозирования на Python и использую реализацию SVM scikits learn. Это было действительно здорово, легко и относительно быстро. К сожалению, я начинаю становиться ...
вопрос задан: 3 April 2016 07:53
0
ответов

What do work items execute when conditionals are used in GPU programming?

If you have work items executing in a wavefront and there is a conditional such as: if(x){ ... } else{ .... } What do the work-items execute? is it the case whereby all ...
вопрос задан: 30 March 2016 22:21
0
ответов

Как правильно рассчитать FPS, учитывая, что у графических процессоров есть задача очереди и являются асинхронными?

Я всегда предполагал, что правильный способ вычисления FPS - это просто рассчитать время, необходимое для выполнения итерации цикла отрисовки. И большая часть Интернета, похоже, соответствует. Но! Современный ...
вопрос задан: 17 March 2016 08:10
0
ответов

Сколько «ядер CUDA» имеет каждый мультипроцессор графического процессора?

Я знаю, что в устройствах до архитектуры Fermi было 8 SP в одном мультипроцессоре. Такое же количество в архитектуре Ферми?
вопрос задан: 2 March 2016 17:01
0
ответов

Когда полезна память CUDA __shared__?

Может ли кто-нибудь помочь мне с очень простым примером использования разделяемой памяти? Пример, включенный в руководство по программированию Cuda C, кажется загроможденным несущественными деталями. Например, если я скопирую ...
вопрос задан: 14 February 2016 21:42
0
ответов

Основное использование нескольких графических процессоров

Как я могу использовать два устройства, чтобы улучшить, например, производительность следующего кода (сумма векторов)? Можно ли использовать больше устройств «одновременно»? Если да, то как я могу управлять ...
вопрос задан: 15 January 2016 14:34
0
ответов

Как измерить внутреннее время ядра в NVIDIA CUDA?

Я хочу измерить время внутреннего ядра графического процессора, как его измерить в NVIDIA CUDA? например __global__ void kernelSample() { здесь какой-то код получить время начала какой-то код здесь получить время остановки какой-то ...
вопрос задан: 15 January 2016 10:15
0
ответов

CPU против GPU для (конв) вычислений нейронных сетей [закрыто]

Я студент по искусственному интеллекту, который собирается много работать с Pylearn и Theano (я мог бы также попробовать факел и кофе) в этом году для внедрения нейронных сетей, и я собираюсь купить ноутбук для этого. Я мог бы ...
вопрос задан: 6 September 2015 20:57