Как начать работу с анализом больших данных [закрыто]

Я ' Я долгое время использовал R и недавно начал работать с Python. Используя обычные системы РСУБД для хранилищ данных и R / Python для обработки чисел, я чувствую, что сейчас необходимо заняться анализом больших данных.

Я хотел бы знать, как начать работу с обработкой больших данных. - Как начать с простого с Map / Reduce и использования Hadoop

  • Как я могу использовать свои навыки в R и Python, чтобы начать анализ больших данных. Например, используя проект Python Disco.
  • Использование пакета RHIPE и поиск наборов данных игрушек и проблемных областей.
  • Поиск нужной информации, позволяющей мне решить, нужно ли мне переходить на NoSQL из баз данных типа РСУБД

Все В общем, я хотел бы знать, как начать с малого и постепенно наращивать свои навыки и ноу-хау в области анализа больших данных.

Спасибо за ваши предложения и рекомендации. Прошу прощения за общий характер этого запроса, но я хочу получить более широкое представление по этой теме.

  • Harsh
41
задан Caleb Bell 25 September 2012 в 16:34
поделиться