31
ответ

Как исправить все значения в mongodb? [Дубликат]

Я хотел бы выделить все значения на шаге карты. Я попытался испустить (this.id, это); как результат получился следующим образом: {"_id": 15, "value": "[объект BSON], [объект BSON], [объект BSON]"}
вопрос задан: 8 November 2016 13:57
19
ответов

Mapreduce на двух разностях. коллекции Мондобба [дубликат]

У меня есть две коллекции: db.sample.find () {"_id": ObjectId ("59e0904aad730d53a04e8ece"), "city": "pune", "extraSkill": ["SUPW", "maths", "science" ]} {"_id": ObjectId ("...
вопрос задан: 19 June 2012 12:55
9
ответов

Как я говорю многоядерному / машина мульти-ЦП обрабатывать вызовы функции в цикле параллельно?

Я в настоящее время разрабатываю приложение, которое имеет один модуль, который загрузит большие объемы данных от базы данных и уменьшит их до намного меньшего набора различными вычислениями в зависимости от...
вопрос задан: 10 November 2008 16:30
8
ответов

Нестатическая переменная, на которую нельзя ссылаться из статического контекста в функции mapper [duplicate]

Я написал программу для уменьшения карты со следующим пользовательским классом Writable: public class compoWritable реализует Writable, WritableComparable & lt; compoWritable & gt; {int rnode; int snode; ...
вопрос задан: 24 April 2012 17:20
6
ответов

Существует ли.NET, эквивалентная Apache Hadoop? [закрытый]

Так, я смотрел на Hadoop с пристальным интересом, и быть честным я очарован, вещи не становятся намного более прохладными. Моя единственная незначительная проблема, я - разработчик C#, и это находится в Java. Не то, чтобы я не делаю...
вопрос задан: 9 March 2013 15:16
6
ответов

Крупномасштабное Машинное обучение [закрывается]

Я должен выполнить различные методы машинного обучения на большом наборе данных (10-100 миллиардов записей), проблемы являются главным образом вокруг анализа текста / извлечением информации и включают различные методы ядра, но...
вопрос задан: 8 July 2010 23:58
5
ответов

Простое объяснение MapReduce?

Связанный с моим вопросом о CouchDB. Кто-либо может объяснить MapReduce в терминах, которые мог понять numbnuts?
вопрос задан: 23 May 2017 11:55
5
ответов

Невозможно скомпилировать вектор & lt; queue & lt; t & lt; T1, T2 & gt; & gt; & gt; & gt; [Дубликат]

Мне нужно иметь std :: vector safequeues std :: pair для проблемы с уменьшением карты, но компилятор всегда дает мне ту же ошибку из-за плохо сформированного определения. Я уже прочитал много сообщений ...
вопрос задан: 1 May 2015 11:42
5
ответов

Как форматировать вывод на карте с помощью mongodb? [Дубликат]

Мне нужно показать результат как {«_id»: {«movie»: «Osage County»}, «актеры»: [«Meryl Streep», «Julia Roberts»]}, но я получаю это вместо этого - {"_id" : {"фильм": "Осейдж ...
вопрос задан: 26 February 2014 15:47
5
ответов

20 миллиардов Строк/Месяц - Hbase / Hive / Greenplum / Что?

Я хотел бы использовать Вашу мудрость для того, чтобы взять правильное решение для системы хранилища данных. Вот некоторые детали для лучше понимания проблемы: Данные организованы в структуре схемы "звезда" с...
вопрос задан: 25 December 2013 03:59
5
ответов

Действительно ли MapReduce является правильным для меня?

Я работаю над проектом, который имеет дело с анализом очень большого объема данных, таким образом, я обнаружил MapReduce справедливо недавно, и прежде чем я погружусь дальше в него, я хотел бы удостовериться мой...
вопрос задан: 13 January 2010 20:43
5
ответов

Какие проблемы mapreduce могут решить?

Существует ли теоретический анализ, доступный, который описывает, какие проблемы mapreduce могут решить?
вопрос задан: 1 April 2009 12:44
5
ответов

как реализовать вычисление собственного значения с MapReduce/Hadoop?

Это возможно, потому что PageRank был формой собственного значения и именно поэтому представленного MapReduce. Но там кажется, что проблемы в фактической реализации, такие как каждый ведомый компьютер должны поддержать копию...
вопрос задан: 23 December 2008 16:30
4
ответа

Конфигурирование Hadoop, регистрирующегося для предотвращения слишком многих файлов журнала

У меня есть проблема с Hadoop, производящим слишком много файлов журнала в $HADOOP_LOG_DIR/userlogs (файловая система Ext3 позволяет только 32 000 подкаталогов), который похож на ту же проблему в этом вопросе:...
вопрос задан: 23 May 2017 11:46
4
ответа

Объединение в цепочку нескольких заданий MapReduce в Hadoop

Во многих реальных ситуациях, где Вы применяете MapReduce, заключительные алгоритмы заканчивают тем, что были несколькими шагами MapReduce. т.е. Map1, Reduce1, Map2, Reduce2, и так далее. Таким образом, у Вас есть вывод от...
вопрос задан: 1 May 2017 18:03
4
ответа

Hadoop одна Карта и несколько Уменьшают

У нас есть большой набор данных для анализа с несколькими, уменьшают функции. Все уменьшают работу алгоритма над тем же набором данных, сгенерированным той же функцией карты. Чтение большого набора данных стоит слишком много, чтобы сделать это...
вопрос задан: 6 February 2016 22:16
4
ответа

Что, Отображают/Уменьшают?

Я слышу много о, отображают/уменьшают, особенно в контексте Google, с массовым параллелизмом, вычисляют систему. Что точно это?
вопрос задан: 9 January 2013 08:20
4
ответа

Где я запускаю с распределенных вычислений?

Я интересуюсь изучением методов для распределенных вычислений. Как Java-разработчик, я, вероятно, готов запуститься с Hadoop. Вы могли рекомендовать некоторые книги/учебные руководства/статьи для начала?
вопрос задан: 2 May 2012 07:43
4
ответа

Hadoop java.lang.OutOfMemoryError: превышен верхний предел GC [дубликат]

Я работаю над проектом hadoop, и я пытаюсь построить алгоритм с разделенным полу-объединением. Я новичок в hadoop, и хотя я еще не все понял, у меня возникли некоторые проблемы. Теперь я в первом ...
вопрос задан: 11 April 2012 16:56
4
ответа

Каково максимальное значение для составного ключа CouchDB?

Я использую то, что, кажется, общий прием для создания представления соединения://у Клиента есть много Заказов; покажите им вместе в одном представлении: функция (документ) {если (документ. Введите == "клиент") {испускают ([документ. _ идентифик
вопрос задан: 26 July 2009 12:41
4
ответа

Реализация MapReduce в Scala

Я хотел бы узнать хорошую и устойчивую платформу MapReduce, быть использованным от Scala.
вопрос задан: 12 June 2009 04:34
4
ответа

Как Вы используете MapReduce/Hadoop? [закрытый]

Я ищу немного общей информации о том, как другие люди используют Hadoop или другие подобные MapReduce технологии. В целом мне любопытно к тому, пишете ли Вы приложения MR для обработки...
вопрос задан: 1 December 2008 16:31
3
ответа

Итерация по массиву Swift и изменение значений

Мне нужно изменить значения массива Swift. Моя первая попытка состояла в том, чтобы просто выполнить итерацию, но это не работает, так как я получаю только копию каждого элемента, и изменения не влияют на исходный массив. Цель ...
вопрос задан: 3 March 2019 20:05
3
ответа

Используя Hadoop, мои редукторы, как гарантируют, получат все записи с тем же ключом?

Я выполняю задание Hadoop с помощью Hive на самом деле, который предполагается к uniq строкам во многих текстовых файлах. На уменьшать шаге это выбирает последний раз запись с меткой времени для каждого ключа. Делает гарантию Hadoop...
вопрос задан: 5 May 2015 21:33
3
ответа

Карта Уменьшает Платформы/Инфраструктуру

Карта Уменьшает, шаблон, который, кажется, получает большую тягу в последнее время, и я начинаю видеть, что он проявляет в одном из моих проектов, который фокусируется на конвейере обработки событий (iPhone Accelerometer и GPS...
вопрос задан: 14 July 2012 02:55
3
ответа

Hadoop на Windows Server

Я думаю об использовании hadoop обрабатывать файлы крупного текста на своих существующих окнах 2 003 сервера (приблизительно 10 четырехъядерных машин с 16 ГБ RAM), вопросы: Есть ли любое хорошее учебное руководство о том, как...
вопрос задан: 11 January 2012 07:34
3
ответа

Что лучший способ состоит в том, чтобы считать уникальными посетителями с Hadoop?

эй все, просто начав на hadoop и любопытный, что лучший способ в mapreduce состоял бы в том, чтобы считать уникальными посетителями, если бы Ваши файлы журнала были похожи на это... ДАТА siteID имя пользователя действия 05-05-...
вопрос задан: 21 May 2010 09:37
3
ответа

Отладка hadoop приложения

Я пытался распечатать значения с помощью System.out.println (), но они не появятся на консоли. Как я распечатываю значения в отобразить/уменьшить приложении для отладки использования целей Hadoop? Спасибо...
вопрос задан: 14 May 2010 14:31
3
ответа

MongoDB: Какой смысл того, чтобы использовать MapReduce без параллелизма?

Заключая в кавычки http://www.mongodb.org/display/DOCS/MapReduce#MapReduce-Parallelism С прямо сейчас, задания MapReduce на единственном процессе mongod являются единственными, распараллелил. Это происходит из-за ограничения дизайна...
вопрос задан: 8 May 2010 19:21
3
ответа

Hadoop или Hadoop Streaming для MapReduce на AWS

Я собираюсь запустить mapreduce проект, который будет работать на AWS, и мне дарят выбор, для или использования Java или C++. Я понимаю, что запись проекта в Java сделала бы больше функциональности...
вопрос задан: 7 May 2010 19:13