MapReduce и SQL GROUP BY

Я пытался понять основы MapReduce в MongoDB, и даже после его реализации я не уверен, чем именно он отличается от GROUP BY в SQL или даже от собственной GROUP BY в Mongo. В SQL-сервере GROUP BY может выполняться потоком или хеш-агрегатом. Разве MapReduce не похож на агрегат хэшей, только на большом количестве серверов?

Я читал в местах, что MR для MongoDB должен запускаться как фоновый процесс, поскольку это «тяжелая операция». Учитывая, что данные сегментированы, не будет ли GROUP BY столь же «тяжелым»? Тем не менее, я только пытаюсь сравнить те типы операций, которые можно реализовать как в виде задания MR, так и с использованием запроса GROUP BY.

Есть ли что-то, что GROUP BY не может сделать, и что может сделать только MR?

Кроме того, Hadoop, кажется, очень хорош в MR (. Это только то, что я читал. Я никогда не работал с Hadoop ). Чем MR Hadoop отличается от Mongo?

Я в замешательстве. Пожалуйста, помогите мне или направьте меня к хорошему учебнику, который объясняет необходимость MapReduce.

9
задан Aafreen Sheikh 6 July 2012 в 08:15
поделиться