У меня есть нерегулярный временной ряд событий (сообщений) с использованием xts
, и я хочу рассчитать количество событий, происходящих в скользящем недельном окне (или раз в две недели или 3 дня и т. д.). Данные выглядят так:
postid
2010-08-04 22:28:07 867
2010-08-04 23:31:12 891
2010-08-04 23:58:05 901
2010-08-05 08:35:50 991
2010-08-05 13:28:02 1085
2010-08-05 14:14:47 1114
2010-08-05 14:21:46 1117
2010-08-05 15:46:24 1151
2010-08-05 16:25:29 1174
2010-08-05 23:19:29 1268
2010-08-06 12:15:42 1384
2010-08-06 15:22:06 1403
2010-08-07 10:25:49 1550
2010-08-07 18:58:16 1596
2010-08-07 21:15:44 1608
, что должно дать что-то вроде
nposts
2010-08-05 00:00:00 10
2010-08-06 00:00:00 9
2010-08-07 00:00:00 5
для 2-дневного окна. Я просмотрел rollapply
, apply.rolling
из PerformanceAnalytics
и т. д., и все они предполагают обычные данные временных рядов. Я попытался изменить все время только на день публикации сообщения и использовать что-то вроде ddply
для группировки по дням, что меня приблизило. Однако пользователь может не публиковать сообщения каждый день, поэтому временной ряд все равно будет нерегулярным. Я мог бы заполнить пробелы нулями, но это может сильно раздуть мои данные, а они уже довольно велики.
Что мне делать?