Я работаю с большими, разреженные матрицы (матрицы функций документа, созданные из текста) в python. Чтобы разобраться в них, требуется довольно много времени обработки и памяти, и я полагаю, что разреженные матрицы могут предложить некоторые улучшения. Но меня беспокоит, что использование библиотеки с разреженными матрицами затруднит подключение к другим модулям python (и R через rpy2).
Могут ли люди, перешедшие через этот мост, уже дать какой-нибудь совет? Каковы плюсы и минусы использования разреженных матриц в python / R с точки зрения производительности, масштабируемости и совместимости?