Excel или R: подготовка временных рядов из нескольких источников?

В последнее время мне часто приходилось обрабатывать данные временных рядов из нескольких источников .csv в одном анализе. Предположим для простоты, что все ряды являются регулярными квартальными рядами (без пропущенных значений между ними). Обычно исходные данные .csv содержат столбец даты и 1–3 переменных. К сожалению, серии файлов .csv не имеют одинаковой длины.

Я начал организовывать свой набор данных в R и в итоге получил большой беспорядок, содержащий множество команд window () . Кроме того, мне пришлось объединить NA и исходные серии, прежде чем превращать их в объекты ts () , потому что я обнаружил, что объединяющиеся (многомерные) объекты ts () настолько противоречат интуиции. Обратите внимание, что я добавил NA, потому что хотел, чтобы все серии были одинаковой длины. Конечно, я мог бы обрезать более длинные, но в конечном итоге я терял наблюдения, если не использовал более короткие серии.

Я подумал о написании функции, которая читает файлы .csv и использует столбец даты для создания объектов ts () и, возможно, с другой функцией объединяет все отдельные серии для создания многомерных серий, содержащих NA, когда данные пропал, отсутствует. Я обнаружил, что постоянно меняю типы данных, читая руководства по ts и zoo - я просто не мог поверить, что это так сложно.

Я действительно думал, что эта проблема действительно распространена, и думал о приготовлениях в Excel .. Я имею в виду Я действительно ненавижу Excel, но на этот раз мне интересно, что делают более опытные пользователи? R или Excel?

РЕДАКТИРОВАТЬ: добавлены некоторые примерные данные (необходимо агрегировать ежедневные данные) файл1:

27.05.11;5965.95
26.05.11;5947.06
25.05.11;5942.82
24.05.11;5939.98

файл2 (без столбца даты, но я знаю начало и частоту)

Germany;Switzerland;USA;OECDEurope
69,90974;61,8241;55,60966;64,96157
67,0394;62,18966;56,47361;64,15152
70,56651;63,6347;56,87237;65,43568

файл3:

1984-04-01,33.3238396624473
1984-07-01,63.579833082501
1984-10-01,35.8375401560349

Я признаю, что примерные данные действительно помогают проиллюстрировать вопрос, но это, скорее, тип наилучшей практики, касающийся большего опытные пользователи, чем я. Как вы готовите данные для многомерного анализа TS?

7
задан Matt Bannert 28 June 2011 в 16:53
поделиться