Какая библиотека является наиболее зрелой для построения конвейера анализа данных на Java / Scala для Hadoop?

Недавно я нашел много вариантов, и их сравнение интересно в первую очередь по степени зрелости и стабильности.

  1. Crunch - https://github.com/cloudera/crunch
  2. Scrunch - https://github.com/cloudera/crunch/tree/master/scrunch
  3. Каскадирование - http://www.cascading.org/
  4. Scalding https://github.com/twitter/scalding
  5. FlumeJava
  6. Scoobi - https://github.com/ NICTA / scoobi /

18
задан kellyfj 26 March 2015 в 16:48
поделиться