Хорошее использование шторма?

Я читал о Storm и играл с примерами из Storm-Starter.

Думаю, я понял эту концепцию, и она очень хорошо применима ко многим случаям. У меня есть тестовый проект, который я хочу сделать, чтобы узнать об этом больше, но мне интересно, действительно ли Storm подходит для этого.

Концептуальная проблема, с которой я столкнулся, связана с определением «потоковой передачи». Кажется, что Storms будет работать как шарм, подписываясь на поток и обрабатывая его в реальном времени, но на самом деле у меня нет потока, а скорее ограниченный набор данных, который я хочу обработать.

Я знаю, что для этого есть хадуп, но меня интересуют возможности Storm в реальном времени, а также другие интересные моменты, которые Натан, написавший Storm, упоминает в своих выступлениях.

Мне было интересно, пишут ли люди Spouts, которые опрашивают непотоковые API-интерфейсы, а затем сравнивают результаты, может быть, для имитации потока?

Второй важный момент: похоже, что топологии Storm никогда не заканчивают обработку до тех пор, пока не прервутся, что опять же не относится к моему случаю. Я хотел бы, чтобы моя топология знала, что как только мой конечный список исходных данных будет завершен, обработка может быть прекращена и может быть получен окончательный результат.

Все это имеет смысл с точки зрения Storm, или я смотрю не на то? Если да, то какие альтернативы вы предлагаете для такого рода параллельных вычислений в реальном времени?

Спасибо!

8
задан Matthias J. Sax 23 November 2015 в 13:23
поделиться

0 ответов

Другие вопросы по тегам:

Похожие вопросы: