Как заставить свинью работать с файлами LZO?

Итак, я видел пару учебников для этого онлайн, но каждый, кажется, говорит сделать что-то другое. Кроме того, каждый из них, похоже, не указывает, пытаетесь ли вы получить вещи для работы на удаленном кластере или локально взаимодействовать с удаленным кластером и т. Д. ...

, которые сказали, что моя цель - просто Получите мой локальный компьютер (MAC), чтобы заставить свинья работать с сжатыми файлами LZO, которые существуют в кластере Hadoop, который уже установлен для работы с файлами LZO. У меня уже есть Hadoop устанавливает локально и может получить файлы из кластера с помощью Hadoop fs - [Command] .

У меня уже есть свинья, установленная локально и обменивающаяся с кластером Hadoop, когда я запускаю сценарии или когда я просто бегаю через ворчание. Я могу загрузить и играть с файлами не LZO, просто отлично. Моя проблема только с точки зрения выяснения способа загрузить файлы LZO. Может быть, я могу просто обработать их через экземпляр кластера ElephantBird? Я понятия не имею и нашел только минимальную информацию в Интернете.

Итак, любой короткий урок или ответ на это был бы потрясающим, и, надеюсь, поможет больше людей, чем только я.

6
задан Eli 1 September 2011 в 23:07
поделиться