0
ответов

Hadoop, альтернатива обработки в реальном времени Mahout

Я намеревался использовать hadoop в качестве «вычислительного кластера» в моем проекте. Однако затем я прочитал, что Hadoop не предназначен для систем реального времени из-за накладных расходов, связанных с запуском задания. Я ищу ...
вопрос задан: 1 October 2011 10:21
0
ответов

HBase & Mahout - Использование HBase в качестве хранилища данных / источника для Mahout - Классификация

Я работаю над большим проектом классификации текста, и у нас есть наши текстовые данные (простые сообщения ) хранится в HBase. У нас есть две проблемы. Во-первых, мы хотели бы использовать HBase в качестве источника для Mahout ...
вопрос задан: 25 July 2011 12:52
0
ответов

На практике, сколько машин вам нужно, чтобы Hadoop / MapReduce / Mahout ускорили вычисления с высокой степенью распараллеливания?

Мне нужно выполнить тяжелые вычисления с машинным обучением. В локальной сети у меня простаивает небольшое количество машин. Сколько машин мне понадобится для распределения моих вычислений с помощью hadoop / ...
вопрос задан: 13 July 2011 17:00
0
ответов

K-средства с действительно большой матрицей

Мне нужно выполнить кластеризацию k-средних на действительно огромной матрице (около 300.000x100.000 значений, что больше 100Гб). Я хочу знать, могу ли я использовать программное обеспечение R для выполнения этого или weka. Мой компьютер ...
вопрос задан: 16 June 2011 13:32
0
ответов

Интерпретация результатов работы mahout clusterdumper

Я провел кластеризацию тестировать на просканированных страницах (более 25К документов; набор персональных данных). Я сделал кластерный дамп: $ MAHOUT_HOME / bin / mahout clusterdump --seqFileDir output / clusters-1 / --output ...
вопрос задан: 27 April 2011 14:03
0
ответов

Развертывание Mahout в кластере hadoop

Я хочу запустить пример K-средних Mahout в кластере hadoop из 5 машин. Какие jar-файлы Mahout мне нужно хранить во всех узлах, чтобы K-средства выполнялись распределенным образом ....
вопрос задан: 15 April 2011 12:44
0
ответов

Выбор платформы машинного обучения [закрыто]

У меня есть набор данных пользователей и их показатели погашения кредита (сколько времени они потребовали, сколько платежей и т. д.). Теперь я хочу проанализировать прошлую историю займов пользователя и сказать: «Если мы одолжим им X, они больше всего…
вопрос задан: 27 January 2011 14:06
0
ответов

Классификация данных с помощью Apache Mahout

Я пытаюсь решить простую задачу классификации. Проблема: у меня есть набор текста, и я должен классифицировать его в зависимости от содержания. Решение с использованием Mahout: Я понял, что мне нужно ...
вопрос задан: 9 November 2010 19:29
0
ответов

Сколько Java нужно использовать Hadoop и Mahout эффективно?

Я - разработчик PHP. Позвольте нам просто избавиться от этого теперь. Но Hadoop – и Mahout в особенности – возбудили мой интерес. Я готов взять погружение в Java для использования их. Таким образом от людей...
вопрос задан: 22 July 2010 18:21