Я работал над составлением / тестированием методики, которую я разработал для решения дифференциальных уравнений для скорости и эффективности.
Это потребует хранения, манипулирования, изменения размера и (в какой-то момент), вероятно, диагонализации очень больших разреженных матриц. Я хотел бы иметь возможность иметь строки, состоящие из нулей и нескольких (скажем <5) единиц, и добавлять их по несколько за раз (в порядке количества используемых процессоров).
Я думал, что это будет было бы полезно иметь ускорение графического процессора - поэтому любые предложения относительно того, как лучше всего воспользоваться этим, также будут оценены (например, pycuda, theano и т. д.)