Каковы недостатки использования файлов .Rdata по сравнению с HDF5 или netCDF?

Меня попросили изменить программное обеспечение, которое в настоящее время экспортирует файлы .Rdata, чтобы оно экспортировалось в «независимом от платформы двоичном формате», таком как HDF5 или netCDF. Были приведены две причины:

  1. Файлы Rdata могут быть прочитаны только R
  2. двоичная информация хранится по-разному в зависимости от операционной системы или архитектуры

Я также обнаружил, что «Руководство по экспорту импорта данных R» не обсуждает файлы Rdata, хотя обсуждает HDF5 и netCDF.

Обсуждение R-help предполагает, что файлы .Rdata не зависят от платформы.

Вопросы:

  1. Насколько обоснованы эти опасения?
    • например. может ли Matlab читать .Rdata без вызова R?
  2. Могут ли другие форматы более полезны в этом отношении, чем файлы .Rdata?
  3. Можно ли написать сценарий, который создавал бы .hdf5 аналоги всех файлов .Rdata, минимизируя изменения к самой программе?

27
задан Iterator 25 October 2011 в 14:40
поделиться