Hadoop MR источник: HDFS против HBase. Преимущества каждого?

Если я правильно понимаю экосистему Hadoop, я могу запускать свои задания MapReduce, получая данные из HDFS или HBase. Предполагая, что предыдущее предположение верно, почему я должен предпочесть одно другому? Есть ли преимущество в производительности, надежности, стоимости или простоте использования в использовании HBase в качестве источника MR?

Лучшее, что я смог найти, это цитата: «HBase - это приложение Hadoop, которое можно использовать, когда вам нужно произвольный доступ для чтения / записи в реальном времени к очень большим наборам данных ». - Том Уайт (2009) Hadoop: Полное руководство, 1-е издание

8
задан Andre 22 September 2010 в 23:06
поделиться