R - очень хороший выбор. Приступайте.
Количество ресурсов в Интернете продолжает расти. Один хороший набор слайдов предоставляет UCLA Stat Consulting Center.
А поскольку вы увлекаетесь эконометрикой, обязательно посмотрите Econometrics with R Гранта Фарнворта на CRAN; Applied Econometrics with R книга Зейлиса и Клейбера тоже очень хороша.
Я предпочитаю R, но можно рассмотреть и другие бесплатные варианты:
комбинация октавы с gnuplot (Octave - бесплатная реализация Matlab)
python с numpy, scipy и matplotlib
Поскольку вас интересует R, вы также можете взглянуть на Incanter . Поскольку он построен на Clojure - диалекте Lisp для JVM - вы сможете использовать огромный массив существующих библиотек Java.
Я удивлен, что никто не упомянул Excel. Как однажды сказал Брайан Рипли (см. Слайд 7):
Давайте не обманываем себя: самый широко используемое программное обеспечение для статистика - Excel.
Действительно, Excel - отличный инструмент для сложения столбцов чисел. При этом, если анализ, который вы проводите, более сложен, вам определенно следует использовать правильный язык программирования.
Из трех очевидных языков манипулирования данными (R, MATLAB и Python) R имеет лучшие инструменты манипулирования данными. См. этот другой вопрос SO для более подробного сравнения.
РЕДАКТИРОВАТЬ: Перечитав это, я звучу скорее сторонником Excel. Я хотел бы расширить свой ответ, чтобы спасти свою репутацию.
Excel доставляет мне гораздо больше проблем, чем пользы. Его широкое использование в моей организации в основном вредно. Из-за этого очень сложно отследить, откуда пришли данные и как работают ваши вычисления. Отладка моделей Excel практически невозможна. Он поощряет локальные хранилища данных вместо центральных баз данных. Он не работает с инструментами diff и затрудняет воспроизводимость ваших научных данных. С семантической точки зрения он не разделяет данные и то, что делается с данными. Мысль о том, что всем вашим переменным нужно место, отвлекает от понимания. Сюжетные возможности до смешного ужасны.
С учетом всего сказанного, Excel полезен для нескольких конкретных вещей:
В качестве программы просмотра CSV. Конечно, в R есть функция View
, но она не так хороша.
Действительно простое исследование данных. Сортировка, фильтрация, добавление столбцов.Я считаю, что с помощью интерфейса «укажи и щелкни» это можно сделать немного быстрее, чем с помощью кода. Конечно, вам придется писать код позже для воспроизводимости, но на начальных этапах Excel вполне подходит для этого.
Графики отчетливые и легко различимы. Если вы видите, что кто-то проводит презентацию с графиком, нарисованным в Excel, вы знаете, что нельзя доверять результатам.
Вот и все. Во всем остальном это беспорядок.