В numpy
самый эффективный способ вычисления xT * x
, где x
] представляет собой большую (200 000 x 1000) плотную матрицу float32
и . T
является оператором транспонирования?
Во избежание сомнений результат будет 1000 x 1000.
edit : В моем исходном вопросе я заявил, что np.dot (xT, x )
занимало несколько часов. Оказалось, что у меня было несколько NaN
, которые проникли в матрицу, и по какой-то причине это полностью убивало производительность np.dot
(любые идеи относительно того, почему?) Это теперь решено, но исходный вопрос остается в силе.