Я имею дело с простой таблицей вида
date variable value
1970-01-01 V1 0.434
1970-01-01 V2 12.12
1970-01-01 V3 921.1
1970-01-02 V1 -1.10
1970-01-03 V3 0.000
1970-01-03 V5 312e6
... ... ...
Пары (дата, переменная) уникальны. Я хотел бы преобразовать эту таблицу в расширенную.
date V1 V2 V3 V4 V5
1970-01-01 0.434 12.12 921.1 NA NA
1970-01-02 -1.10 NA NA NA NA
1970-01-03 0.000 NA NA NA 312e6
И я хотел бы сделать это как можно быстрее, так как мне приходится повторять операцию несколько раз над таблицами с записями 1e6. Я считаю, что в собственном режиме R оба tapply ()
, reshape ()
и d * ply ()
доминируют по скорости с точки зрения данных .таблица
. Я хотел бы проверить производительность последнего на решении на основе sqlite (или другой БД). Это было сделано раньше? Есть ли прирост производительности? И как преобразовать высоту в ширину в sqlite, когда число "широких" поля (дата) являются переменными и не известны заранее?