Я читал о Storm и играл с примерами из Storm-Starter.
Думаю, я понял эту концепцию, и она очень хорошо применима ко многим случаям. У меня есть тестовый проект, который я хочу сделать, чтобы узнать об этом больше, но мне интересно, действительно ли Storm подходит для этого.
Концептуальная проблема, с которой я столкнулся, связана с определением «потоковой передачи». Кажется, что Storms будет работать как шарм, подписываясь на поток и обрабатывая его в реальном времени, но на самом деле у меня нет потока, а скорее ограниченный набор данных, который я хочу обработать.
Я знаю, что для этого есть хадуп, но меня интересуют возможности Storm в реальном времени, а также другие интересные моменты, которые Натан, написавший Storm, упоминает в своих выступлениях.
Мне было интересно, пишут ли люди Spouts, которые опрашивают непотоковые API-интерфейсы, а затем сравнивают результаты, может быть, для имитации потока?
Второй важный момент: похоже, что топологии Storm никогда не заканчивают обработку до тех пор, пока не прервутся, что опять же не относится к моему случаю. Я хотел бы, чтобы моя топология знала, что как только мой конечный список исходных данных будет завершен, обработка может быть прекращена и может быть получен окончательный результат.
Все это имеет смысл с точки зрения Storm, или я смотрю не на то? Если да, то какие альтернативы вы предлагаете для такого рода параллельных вычислений в реальном времени?
Спасибо!