mapreduce - список вопросов по программированию mapreduce

0

ответов

Полное использование всех ядер в псевдораспределенном режиме Hadoop

Я выполняю задачу в псевдораспределенном режиме на своем 4-ядерном ноутбуке. Как я могу убедиться, что все ядра используются эффективно. В настоящее время мой счетчик вакансий показывает, что одновременно выполняется только одно задание. Есть ли ...

вопрос задан: 2 December 2011 14:04

0

ответов

Связь между python map reduce и map / reduce для облачных вычислений?

Я новичок в Python, кто-нибудь знает, какие отношения между функциями map () / reduce () и концепцией MapReduce в Python (и функциональных языках) связаны с распределенными вычислениями?

python cloud mapreduce

вопрос задан: 22 November 2011 10:35

0

ответов

Где запускаются Riak Post-Commit Hooks?

Я пытаюсь оценить использование Riak's Post-Commit Hooks для создания распределенного инкрементного индекса на основе MapReduce, но мне интересно, на каких узлах Riak на самом деле запускаются Post-Commit Hooks. Запускаются ли они ...

erlang mapreduce commit riak

вопрос задан: 21 November 2011 17:47

0

ответов

Различные способы настройки памяти для дочернего процесса TaskTracker (Mapper и Reduce Tasks)

В чем разница между установкой mapred.job.map.memory.mb и mapred.child.java.opts с использованием -Xmx для управления максимальным объемом памяти, используемым задачами Mapper и Reduce? Какой из них имеет приоритет?

memory hadoop mapreduce task

вопрос задан: 6 November 2011 14:49

0

ответов

Как настроить класс с возможностью записи в Hadoop?

Я пытаюсь реализовать класс с возможностью записи, но понятия не имею, как реализовать класс с возможностью записи, если в моем классе есть вложенный объект, например список и т. Д. Может ли кто-нибудь мне помочь? спасибо общественный класс ...

java hadoop mapreduce

вопрос задан: 3 November 2011 13:52

0

ответов

MapReduce с использованием SQL Server в качестве источника данных

В настоящее время я изучаю возможность использования MapReduce для поддержки инкрементальных построений представлений в SQL Server . По сути, используйте MapReduce для создания материализованных представлений. Я немного застрял в банкомате. мышление ...

sql-server sql-server-2005 couchdb mapreduce

вопрос задан: 26 October 2011 14:37

0

ответов

Custom partitioner example

Я пытаюсь написать новое задание Hadoop для входных данных, которые несколько перекошены. Аналогией для этого может быть пример подсчета слов в учебнике по Hadoop, за исключением того, что, скажем, одно конкретное слово присутствует много ...

hadoop mapreduce partitioning

вопрос задан: 24 October 2011 23:44

0

ответов

Промежуточный вывод Hadoop MapReduce

Есть ли способ вывода в журнал промежуточных (этап отображения) вывода задания MapReduce без редактирования приложения? (Приложение не мое, но кластер есть, и я могу настроить Hadoop ...

logging hadoop mapreduce

вопрос задан: 23 October 2011 16:54

0

ответов

MongoDB incremental mapReduce, выберите только новые документы, добавленные после последнего mapReduce

Допустим, у меня есть коллекция с документами, которая выглядит следующим образом (просто упрощенный пример, но он должен показывать схему):> db.data.find () {"_id": ObjectId ("4e9c1f27aa3dd60ee98282cf"), "type": ...

mongodb mapreduce

вопрос задан: 17 October 2011 13:13

0

ответов

Hadoop - увеличение количества задач карты в xml не увеличивает количество задач карты при запуске

Я добавил следующее в свой conf / mapred-site.xml mapred.tasktracker.map.tasks.maximum < / name> 4 ...

hadoop mapreduce

вопрос задан: 7 October 2011 23:30

0

ответов

Как установить текущую дату и время с помощью подготовленного оператора?

В базе данных есть столбец с типом данных DATETIME. Я хочу установить это значение столбца в текущую дату и время, используя 'PreparedStatement. Как это сделать?

java hadoop mapreduce

вопрос задан: 2 October 2011 12:13

0

ответов

mongodb: как отладить map/reduce в оболочке mongodb

Я новичок в MongoDB, я использую map/reduce. Может ли кто-нибудь подсказать мне, как отлаживать при использовании map/reduce? Я использовал функцию "print()", но в оболочке MongoDB ничего не выводится. Ниже приводится мой reduce ...

debugging shell mongodb mapreduce

вопрос задан: 23 September 2011 09:48

0

ответов

RavenDB: Как использовать индексы Multi Maps / Reduce

У меня довольно простая модель: открытый класс PhraseMeta: {public int Id {get; набор; } общедоступная строка ModuleName {получить; набор; } общедоступная строка Описание {получить; набор; } public DateTime ModifiedDate {get; ...

.net nosql mapreduce ravendb

вопрос задан: 21 September 2011 18:08

0

ответов

Как установить количество задач карты в хадупе 0.20?

Я пытаюсь установить количество задач карты для запуска в хадупе 0.20. Я использую старый апи. Вот опции, которые я пробовал до сих пор: conf.set("mapred.tasktracker.map.tasks.max", "5")....

java hadoop mapreduce

вопрос задан: 19 September 2011 21:48

0

ответов

Как Hive решает, когда использовать карту уменьшать, а когда нет?

В качестве простого примера, выберите * из таблички; НЕ БЫВАЙТЕ лягнуть в карту уменьшать, а выберите счет(*) из таблички; DOES. Какой общий принцип используется для принятия решения о том, когда использовать сокращение карты (по ульям)?....

hadoop mapreduce hive

вопрос задан: 19 September 2011 04:27

0

ответов

Выберите Разметить более одного поля, используя карту MongoDB Уменьшить

Я хочу выполнить это оператор SQL На Mongodb: выберите отчетливую книгу, автор от библиотеки до сих пор до сих пор MongoDB только поддерживает одно поле одновременно. Для более чем одного поля мы должны использовать группу ...

mongodb mapreduce

вопрос задан: 18 September 2011 10:27

0

ответов

Как начать обучение Hadoop [Закрыто]

Я веб-разработчик. У меня есть опыт в веб-технологиях, таких как JavaScript, jQuery, PHP, HTML. Я знаю основные концепции C. Недавно я предпринимал интерес к участию в Mapreatuce и ...

hadoop mapreduce

вопрос задан: 6 September 2011 00:13

0

ответов

Git предупреждает, если последовательность появляется в источнике (или diff)

Я хотел бы, чтобы при постановке † в git-репо ‡, если изменения, которые я собираюсь зафиксировать, содержат определенную последовательность (скажем, @ todo или @ hack). Может ли кто-то показать мне, как этого добиться? † или предупредил. ‡ ...

hadoop mapreduce hdfs

вопрос задан: 3 September 2011 04:52

0

ответов

В Mongodb Maprecuce, как я могу сгладить объект значений?

Я пытаюсь использовать MongoDB для анализа файлов журнала Apache. Я создал коллекцию квитанций из журналов Apache Access. Вот сокращенное резюме того, как выглядят мои модели: db.receipts.findone () {...

mongodb mapreduce

вопрос задан: 31 August 2011 13:55

0

ответов

Пользовательский формат ввода MapReduce - не удается найти конструктор

Я пишу собственный формат ввода для Hadoop 0.20.2 и обнаруживаю исключение NoSuchMethodException. Я не могу избавиться из. Я начал с: открытый класс ConnectionInputFormat extends FileInputFormat

java hadoop mapreduce

вопрос задан: 22 August 2011 22:00

0

ответов

Кассандра InvalidRequestException(почему:[MyKeyspace][MyColumnFamily][6675...6c74] = [6c86...e65720] неудачная валидация (строка не валидировалась.))

Я использую Кассандру с Хадупом для ввода и вывода. Во время выполнения задания на уменьшение вывода я получил ошибку: 2011-08-10 03:54:04,326 WARN org.apache.hadoop.mapred.Child: Ошибка бегущего ребенка java.io....

java hadoop mapreduce cassandra

вопрос задан: 10 August 2011 18:31

0

ответов

F # async stack overflow

Я удивлен переполнением стека в моей асинхронной программе. Я подозреваю, что основная проблема связана со следующей функцией, которая должна составлять два асинхронных вычисления для параллельного выполнения и ...

asynchronous f# mapreduce

вопрос задан: 6 August 2011 22:52

0

ответов

Как печатать на консоли во время выполнения задания MapReduce в hadoop

Я хочу распечатать каждый шаг моей «карты» после ее выполнения на консоли. Что-то вроде System.out.println («Шаг первый завершен»); System.out.println («Шаг второй завершен»); и так далее. Есть ли ...

hadoop mapreduce

вопрос задан: 4 August 2011 13:53

0

ответов

Проблема с -libjars в hadoop

Я пытаюсь запустить задание MapReduce в Hadoop, но вижу ошибку и я не уверен, что происходит не так. Мне нужно передать jar-файлы библиотеки, которые требуются моему картографу. Я вызываю следующее…

hadoop mapreduce

вопрос задан: 31 July 2011 14:43

0

ответов

Повторное использование экземпляра Amazon Elastic MapReduce

Я попробовал простую задачу Map / Reduce с помощью Amazon Elastic MapReduce, и мне потребовалось всего 3 минуты, чтобы выполнить задачу. Можно ли повторно использовать тот же экземпляр для выполнения другой задачи. Несмотря на то, что у меня ...

amazon-ec2 mapreduce elastic-map-reduce

вопрос задан: 30 July 2011 00:27

0

ответов

Плохая производительность для дедупликации 2 миллионов записей с использованием mapreduce в Appengine

У меня около 2 миллионов записей, каждая из которых имеет около 4 строковых полей, которые необходимо проверить на наличие дубликатов. Чтобы быть более конкретным, у меня есть имя, телефон, адрес и имя отца в качестве полей, и я должен проверить ...

java google-app-engine hadoop mapreduce deduplication

вопрос задан: 21 July 2011 02:55

0

ответов

На практике, сколько машин вам нужно, чтобы Hadoop / MapReduce / Mahout ускорили вычисления с высокой степенью распараллеливания?

Мне нужно выполнить тяжелые вычисления с машинным обучением. В локальной сети у меня простаивает небольшое количество машин. Сколько машин мне понадобится для распределения моих вычислений с помощью hadoop / ...

hadoop machine-learning mapreduce mahout

вопрос задан: 13 July 2011 17:00

0

ответов

MongoDB / PyMongo: Как использовать точечную нотацию в функции карты?

Я пытаюсь подсчитать, сколько записей я нашел в каждом почтовом индексе. В моем MongoDB встроенный почтовый индекс; используя точечную нотацию, он расположен по адресу a.res.z (a для адреса, res для жилого помещения, z для zip). ...

mongodb mapreduce pymongo

вопрос задан: 8 July 2011 01:57

0

ответов

Как переводить с SQL на NoSQL / MapReduce?

У меня есть опыт работы с реляционными базами данных, но недавно я начал заниматься CouchDB и был удивлен тем, что некоторые нереляционные операции, которые были бы простыми в SQL, не были первыми…

sql database nosql couchdb mapreduce

вопрос задан: 25 June 2011 18:11

0

ответов

Подходит ли MapReduce для решения проблем в многоядерной среде с одной машиной в памяти?

Подходит ли абстракция MapReduce для решения проблем даже на одной машине? Например, у меня есть 12-ядерная машина, и мне приходится считать слова в тысячах файлов (классический MapReduce ...

algorithm concurrency parallel-processing mapreduce

вопрос задан: 24 June 2011 20:08