Каковы плюсы и минусы выполнения задания в Hadoop с использованием разных языков?

До сих пор я использовал Pig или Java для Map Reduce исключительно для запуска заданий в кластере Hadoop. Недавно я пробовал использовать Python Map Reduce через потоковую передачу Hadoop, и это тоже было довольно круто. Все это имеет для меня смысл, но я немного не понимаю, когда я захочу использовать одну реализацию по сравнению с другой реализацией. Другая. Сокращение карты Java, я использовал в основном исключительно тогда, когда мне нужна скорость, но когда я когда-нибудь захочу использовать что-то вроде потоковой передачи Python вместо того, чтобы просто писать то же самое в меньшем количестве более понятных строк в PIG/Hive? Короче говоря, каковы плюсы и минусы каждого из них?

6
задан Eli 5 March 2012 в 15:14
поделиться