Я ищу очень простой пример умножения матриц для CUBLAS, который может умножить M на N и поместить результаты в P для следующего кода, используя высокопроизводительные операции с графическим процессором:
float M[500][500], N[500][500], P[500][500];
for(int i = 0; i < Width; i++){
for(int j = 0; j < Width; j++)
{
M[i][j] = 500;
N[i][j] = 500;
P[i][j] = 0;
}
}
Пока , большая часть кода, который я нахожу для любого вида умножения матриц с использованием CUBLAS, (на первый взгляд?) чрезмерно сложен.
Я пытаюсь спроектировать базовую лабораторию, где студенты могут сравнивать производительность умножения матриц на GPU и умножения матриц на CPU, предположительно с повышенной производительностью на GPU.