Здесь много написано о разработке рабочего процесса на R для статистических проектов. Самым популярным рабочим процессом, похоже, является модель LCFD Джоша Райха . С main.R
, содержащим код:
source('load.R')
source('clean.R')
source('func.R')
source('do.R')
, так что единственный исходный код ('main.R')
запускает весь проект.
Q: Есть ли причина предпочесть этот рабочий процесс тому, в котором построчная интерпретация выполняется в load.R
, clean.R
и ] do.R
заменяется функциями, которые вызываются из main.R
?
Я не могу найти ссылку, но я где-то читал о SO, что при программировании на R one должны преодолеть свое желание писать все в терминах вызовов функций - то, что R должен был быть написан, является этой строчной интерпретируемой формой.
Вопрос: В самом деле? Почему?
Меня разочаровал подход LCFD, и я, вероятно, собираюсь писать все в терминах вызовов функций. Но прежде чем сделать это, я хотел бы услышать от хороших людей из SO, хорошая ли это идея или нет.
РЕДАКТИРОВАТЬ: Проект, над которым я сейчас работаю, состоит в том, чтобы (1) прочитать в набор финансовых данных, (2) очистить его (довольно сложно), (3) Оценить некоторое количество, связанное с данными, используя мою оценку (4) Оценить это же количество, используя традиционные оценки (5) Отчет о результатах. Мои программы должны быть написаны таким образом, чтобы было легко выполнять работу (1) для разных наборов эмпирических данных, (2) для данных моделирования или (3) с использованием разных оценщиков. ТАКЖЕ, он должен следовать руководствам грамотного программирования и воспроизводимых исследований, чтобы Новичку в коде просто запустить программу, понять, что происходит, и как ее настроить.