Я пытаюсь реализовать большое количество умножений матрицы на матрицу в Python. Первоначально я предполагал, что NumPy будет автоматически использовать мои многопоточные библиотеки BLAS, поскольку я построил его для этих библиотек. Однако, когда я смотрю на top или что-то еще, мне кажется, что код вообще не использует потоки.
Есть идеи, что не так, или что я могу сделать, чтобы легко использовать производительность BLAS?