запрос / агрегирование миллионов записей в реальном времени - hadoop? hbase? cassandra?

Question

запрос / агрегирование миллионов записей в реальном времени - hadoop? hbase? cassandra?

У меня есть решение, которое можно распараллелить, но у меня (пока) нет опыта работы с hadoop / nosql, и я не уверен, какое решение лучше всего подходит для моих нужд. Теоретически, если бы у меня было неограниченное количество процессоров, мои результаты должны были бы возвращаться мгновенно. Итак, любая помощь будет оценена. Спасибо!

Вот что у меня есть:

. Я не могу предварительно вычислить мои агрегированные значения, но поскольку каждый ключ независим, это должно быть легко масштабируемым. В настоящее время у меня есть эти данные в базе данных postgres, где каждый набор данных находится в своем собственном разделе.

разделы хороши, так как могут легко добавлять / удалять / заменять разделы
база данных хороша для фильтрации на основе type_id
базы данных нелегко писать параллельные запросы
базы данных хороши для структурированных данных, а мои данные не структурированы

В качестве доказательства концепции я попробовал hadoop:

создал файл с разделением табуляцией для каждого набора данных для конкретный type_id
загружен в hdfs
map: получено значение / столбец для каждого ключа
reduce: вычисленное среднее и стандартное отклонение

Из моего грубого доказательства концепции я вижу, что это будет хорошо масштабироваться , но я вижу, что hadoop / hdfs имеет задержку. Я читал, что он обычно не используется для запросов в реальном времени (хотя я нормально возвращаю результаты пользователям через 5 секунд).

Есть предложения, как мне подойти к этому? Я подумывал попробовать HBase, чтобы почувствовать это. Стоит ли мне вместо этого посмотреть на Улей? Кассандра? Волдеморт?

спасибо!

7

nosql hadoop cassandra hbase hive

задан anish 26 July 2011 в 17:12

0 ответов

Другие вопросы по тегам:

nosql hadoop cassandra hbase hive

запрос / агрегирование миллионов записей в реальном времени - hadoop? hbase? cassandra?

0 ответов

Похожие вопросы: