Вот моя ситуация, я работаю над механизмом рендеринга видео, который работает на облачных серверах GPU с 64-битной ОС Ubuntu 16.04. Движок слушает запросы пользователей, когда он получает запрос на рендеринг, он ...
Используя виртуальную машину Linux Ubuntu 17.10, я пытаюсь создать shadoworflow с поддержкой GPU. Я установил Cuda 9.2, cuDNN 7.1.4 и NCCL 2.2.13 и использую следующую команду bazel для сборки ...
Я установил tenorflow-gpu в своем ноутбуке (GTX 1060-6GB), и я разрабатываю программу генератора простых чисел с использованием функции tensorflow. Ниже приведен пример кода, который я использую для вычисления простых чисел: def ...
В моем движке рендеринга OpenGL я в настоящее время вырываю 1 кадр после нажатия клавиши, которая начинает выдавать новые вызовы OpenGL. Ниже приведен аварийный стек вызовов, являющийся потоком CVDisplayLink. ...
Я заметил, что графический процессор может иметь сотни ядер, так что параллельные вычисления можно значительно ускорить с их помощью. Похоже, что в ядре ОС для ускорения не используются параллельные алгоритмы. Люди делают ...
Все Macbook Pro 2010 года поставляются с двумя видеокартами - низкопроизводительной встроенной Intel HD и высокопроизводительной дискретной видеокартой NVIDIA - и переключается между ними на лету, в зависимости от потребностей ...
Есть ли способ или инструмент для применения GPU-ускорения при компиляции программ на компиляторе GCC? Сейчас я создал программу для итеративной компиляции заданного списка программ. Это занимает несколько минут....
Как работать с текстурами карт кубов OpenGL в CUDA? Когда кто-то хочет использовать текстуры OpenGL в ядре CUDA, одна из вещей, которую нужно сделать, - это извлечь массив CUDA из зарегистрированного изображения и сопоставленного ресурса ...
Это вопрос о том, как определить размер сетки, блока и потока CUDA. Это дополнительный вопрос к опубликованному здесь: https://stackoverflow.com/a/5643838/1292251 После этого...
Я использую OpenCV для приложения в области компьютерного зрения. Я хотел бы ускорить некоторые операции с матрицами, (матрицы довольно большие )на графическом процессоре, и хочу по возможности избежать кодирования непосредственно в CUDA C....
У меня очень простой ноутбук Toshiba с процессором i3. Кроме того, у меня нет дорогой видеокарты. В настройках дисплея я вижу Intel (HD) Graphics как адаптер дисплея. Планирую изучить ...
Как я могу контролировать, сколько из видеокарты используется, когда я запускаю определенное приложение? Я хочу видеть, насколько мое приложение использует GPU.
Есть ли заметная разница в производительности TensorFlow при использовании графических процессоров Quadro и GeForce? например он использует операции с двойной точностью или что-то еще, что может вызвать падение GeForce ...
Примечание. Этот вопрос касается устройств nVIDIA Compute Capability 2.1. Следующая информация получена из Руководства по программированию CUDA v4.1: В устройствах с вычислительными возможностями 2.1 каждый SM имеет ...
У меня GeForce GTX460 SE, так что это :6 SM x 48 ядер CUDA = 288 ядер CUDA. Известно, что в одном Warp содержится 32 потока, и что в одном блоке одновременно (за раз )может выполняться только один...
Я обучил 3 модели и сейчас выполняю код, который последовательно загружает каждую из 3 контрольных точек и выполняет прогнозы, используя их. Я использую графический процессор. Когда первая модель загружена, она предварительно выделяет ...
Возможно дублирование: фрагмент URL и 302 перенаправляет я интегрирую вход Facebook в мой сайт. Когда Facebook перенаправляет на мой сайт с параметром запроса кода, в конце http:...
когда действительно необходим вызов функции cudaDeviceSynchronize?. Насколько я понял из документации CUDA, ядра CUDA асинхронны, поэтому кажется, что нам следует вызывать...
Размер разделяемой памяти («локальная память» в терминах OpenCL) составляет всего 16 Кбайт на большинстве современных графических процессоров NVIDIA.
У меня есть приложение, в котором мне нужно создать массив из 10 000 целых чисел. так что ...
Я знаю, как сделать наоборот, т.е. получить GpuMat из CvMat с помощью загрузки, но мне нужен CvMat из GpuMat, есть ли любой метод, который можно использовать для этого?
Я создаю некоторые модели прогнозирования на Python и использую реализацию SVM scikits learn. Это было действительно здорово, легко и относительно быстро. К сожалению, я начинаю становиться ...
If you have work items executing in a wavefront and there is a conditional such as: if(x){ ... } else{ .... } What do the work-items execute? is it the case whereby all ...
Я всегда предполагал, что правильный способ вычисления FPS - это просто рассчитать время, необходимое для выполнения итерации цикла отрисовки. И большая часть Интернета, похоже, соответствует. Но! Современный ...
Может ли кто-нибудь помочь мне с очень простым примером использования разделяемой памяти? Пример, включенный в руководство по программированию Cuda C, кажется загроможденным несущественными деталями. Например, если я скопирую ...
Как я могу использовать два устройства, чтобы улучшить, например, производительность следующего кода (сумма векторов)?
Можно ли использовать больше устройств «одновременно»?
Если да, то как я могу управлять ...
Я хочу измерить время внутреннего ядра графического процессора, как его измерить в NVIDIA CUDA?
например __global__ void kernelSample()
{ здесь какой-то код получить время начала какой-то код здесь получить время остановки какой-то ...
Я студент по искусственному интеллекту, который собирается много работать с Pylearn и Theano (я мог бы также попробовать факел и кофе) в этом году для внедрения нейронных сетей, и я собираюсь купить ноутбук для этого. Я мог бы ...