0
ответов

Какая библиотека является наиболее зрелой для построения конвейера анализа данных на Java / Scala для Hadoop?

Недавно я обнаружил много вариантов, и их сравнение интересно в первую очередь по степени зрелости и стабильности. Crunch - https : //github.com/cloudera/crunch Scrunch - https: //github.com/cloudera/crunch/tree / ...
вопрос задан: 26 March 2015 16:48
0
ответов

Автоматическая масштабируемость и обход отказа Flume

Моя компания рассматривает возможность использования flume для обработки довольно большого объема журналов. Мы считаем, что обработка журналов должна быть распределенной, как по объему (масштабируемость), так и по отказоустойчивости (надежность) ...
вопрос задан: 8 December 2011 20:05
0
ответов

Получение метки времени из строки hbase

Можно ли получить метку времени определенного столбца с помощью Hbase API (Get / Put) или HBQL API?
вопрос задан: 30 November 2011 09:00
0
ответов

Какой самый простой способ объединить небольшие блоки HDFS?

Я собираю журналы с Flume в HDFS. Для тестового примера у меня есть небольшие файлы (~ 300 КБ), потому что процесс сбора журналов был масштабирован для реального использования. Есть ли простой способ объединить эти ...
вопрос задан: 13 December 2010 14:08
0
ответов

Распределенный каротаж с лотком [закрыто]

У меня есть мобильная служба, распределенная на 7 серверов, каждый из которых выполняет определенную задачу. Я хочу регистрировать информацию от них, а затем получать из них бизнес-аналитику. Я округлил его до Flume. ...
вопрос задан: 13 November 2010 07:20