Библиотека Dask может считывать данные из нескольких файлов:
>>> import dask.dataframe as dd
>>> df = dd.read_csv('data*.csv')
(Источник: http://dask.pydata.org/en/latest/examples/dataframe-csv. html )
Dataframes Dask реализует подмножество API-интерфейсов данных Pandas. Если все данные вписываются в память, вы можете вызвать df.compute()
, чтобы преобразовать данные в рамку данных Pandas.
Вот другая библиотека: http://sourceforge.net/projects/brahma-fx/
Редактирование : я смотрел на документацию для проекта, который Вы первоначально перечислили и можете сказать, что интерфейс заставляет меня думать: какой смысл того, чтобы использовать.Net. Проект, который я перечислил, имеет более чистый интерфейс, но никакую документацию. Проект, который Вы перечислили, кажется, более посвящен в пути разработки (недавние 2,1 выпуска), но SVN Брахмы не слишком стар (5 WKS).
Другой плакат перечислил платформу Акселератора. Это смотрит очень обещание, хотя его лицензия является некоммерческой (необходимо связаться с ними, если Вы намереваетесь использовать его для какой-либо коммерческой работы), и когда я установил его, это сказало, что установило право, и я не могу найти его в своей системе (это, возможно, было проблемой Vista)!
РЕДАКТИРОВАНИЕ : Я изучил различные библиотеки и могу сказать, вот мои "рекомендации":
Microsoft Research имеет проект под названием "Акселератор" http://research.microsoft.com/apps/pubs/default.aspx?id=70250