KStreams + Spark Streaming + Машинное обучение

Я делаю POC для запуска алгоритма машинного обучения для потока данных.
Моя первоначальная идея состояла в том, чтобы взять данные, используя

Spark Streaming -> Объединить данные из нескольких таблиц -> запустить MLLib для потока данных -> Производить вывод.

Но я смотрю через KStreams. Теперь я в замешательстве !!!

Вопросы:
1. В чем разница между Spark Streaming и Kafka Streaming?
2. Как я могу жениться на KStreams + Spark Streaming + Машинное обучение?
3. Моя идея состоит в том, чтобы тренировать тестовые данные непрерывно, а не проходить периодическое обучение.

8
задан mrsrinivas 29 November 2018 в 10:57
поделиться