0
ответов

Все три конструктора org.apache.hadoop.mapreduce. Job устарели, как лучше всего создать класс Job?

Все три конструктора org.apache.hadoop.mapreduce.Job устарели, есть ли способ создать класс Job нерекомендуемым способом? Спасибо.
вопрос задан: 23 March 2011 03:47
0
ответов

Запрос встроенных объектов в Mongoid / rails 3 («Ниже», Операторы min и сортировка)

Я использую rails 3 с mongoid. У меня есть коллекция акций со встроенной коллекцией цен: класс Stock включает Mongoid :: Document field: name,: type => String field: code,: type = & ...
вопрос задан: 10 March 2011 11:40
0
ответов

Простая структура Java Map / Reduce [закрыто]

Может ли кто-нибудь указать мне на простую инфраструктуру Map / Reduce / API для Java с открытым исходным кодом? Кажется, не так много доказательств того, что такая вещь существует, но кто-то другой может знать другое. Все, что я могу ...
вопрос задан: 10 March 2011 03:24
0
ответов

Как суммировать поля элементов коллекции без их предварительного сопоставления (например, foldLeft / reduceLeft)?

Рассмотрим этот класс: case class Person (val firstName: String, val lastName: String, age: Int) val people = Person ("Jane", "Doe", 42) :: Person ("John", "Doe", 45) :: Person ("Joe", "...
вопрос задан: 21 February 2011 09:45
0
ответов

Как использовать потоковую передачу Hadoop с файлами последовательностей, сжатыми LZO?

Я пытаюсь поиграть с набором данных Google ngrams с помощью Amazon Elastic Map Reduce. На http://aws.amazon.com/datasets/8172056142375670 есть общедоступный набор данных, и я хочу использовать Hadoop ...
вопрос задан: 20 February 2011 23:46
0
ответов

Реализация PageRank с помощью MapReduce

I ' Я пытаюсь разобраться в проблеме с теорией реализации PageRank с помощью MapReduce. У меня есть следующий простой сценарий с тремя узлами: AB C. Матрица смежности находится здесь: A {...
вопрос задан: 17 February 2011 13:09
0
ответов

Сортировка дат в представлениях CouchDB

У меня есть вложенный объект JSON для следующего статуса ключа: {"2011-01-19 09:41:00 AM": "Приложение статуса прототипа" , "2011-01-20 09:41:00 AM": "Играем с CouchDB" } Это небольшое приложение ...
вопрос задан: 23 January 2011 09:42
0
ответов

Может кто-нибудь объяснить map-reduce на C #?

Кто-нибудь может объяснить концепцию map-reduce, особенно в Mongo? Я также использую C #, поэтому любые особенности в этой области также будут полезны.
вопрос задан: 20 January 2011 11:52
0
ответов

Эффективный способ удаления нескольких строк в HBase

Есть ли эффективный способ удалить несколько строк в HBase или мой вариант использования пахнет не подходит для HBase? Есть таблица с названием «диаграмма», которая содержит элементы, которые находятся в диаграммах. Ключи строк - это ...
вопрос задан: 6 January 2011 19:33
0
ответов

Разница между 'distcp' и 'distcp -update'?

В чем разница между hadoop distcp и hadoop distcp -update Оба они будут выполнять одинаковую работу только с небольшая разница в том, как мы их называем. Ни один из них не перезаписывает уже ...
вопрос задан: 6 January 2011 13:37
0
ответов

Hadoop Streaming Job failed error in python

From this guide, I have successfully run the sample exercise. But on running my mapreduce job, I am getting the following error ERROR streaming.StreamJob: Job not Successful! 10/12/16 17:13:38 INFO ...
вопрос задан: 16 December 2010 13:22
0
ответов

Уменьшение карты с помощью агентов F #

После игры с агентами F # я попытался уменьшить карту, используя их. Основная структура, которую я использую: диспетчер карты, который ставит в очередь всю работу, которую нужно выполнить в своем состоянии, и получает запрос на работу от карты ...
вопрос задан: 14 December 2010 09:57
0
ответов

выполнение нескольких заданий MapReduce в hadoop

Я хочу запустить цепочку заданий сокращения карты, поэтому кажется, что самым простым решением является быть контролером работы. скажем, у меня две работы, работа1 и работа2. и я хочу запустить job2 после job1. Что ж, возникли некоторые проблемы. после .
вопрос задан: 7 December 2010 15:16
0
ответов

Что лучше предпочесть - запечатанный класс или перечисление в Scala?

Я пытаюсь реализовать назначение ставок Plurk API для Scala, но у меня есть выбор дизайна. Например, атрибут пола пользователя Plurk может быть одним из "мужской", "женский", " или какой-то другой тип распараллеливания для этой задачи? П
вопрос задан: 4 December 2010 21:41
0
ответов

Потоковая передача Hadoop - Невозможно найти ошибку файла

Я пытаюсь запустить питон с потоковой передачей Hadoop работа. bin / hadoop jar contrib / streaming / hadoop-0.20.1-streaming.jar -D stream.non.zero.exit.is.failure = true -input / ixml -output / oxml -mapper scripts / ...
вопрос задан: 2 December 2010 21:18
0
ответов

При начальной загрузке эластичной карты amazon reduce job , может ли мой сценарий использовать sudo?

Мне нужно: sudo apt-get install rubygems sudo gem install <много драгоценных камней> есть ли у действия начальной загрузки доступ sudo?
вопрос задан: 2 December 2010 15:48
0
ответов

RavenDB Map-Reduce Example using .NET Client

I'm looking for an example of how to implement and use Map-Reduce within the RavenDB .NET Client. I'd like to apply it to a specific scenario: generating unique and total visitor counts. A sample ...
вопрос задан: 23 November 2010 10:28
0
ответов

Using Hadoop for the First Time, MapReduce Job does not run Reduce Phase

I wrote a simple map reduce job that would read in data from the DFS and run a simple algorithm on it. When trying to debug it I decided to simply make the mappers output a single set of keys and ...
вопрос задан: 23 November 2010 06:16
0
ответов

Какие существуют системы для управления логикой / проверкой внутреннего и внешнего интерфейса?

Мне просто интересно, как люди, работающие в группах, управляют взаимосвязью между логикой и проверкой в бэкэнд, скажем, на php, и точно такая же логика и проверка во внешнем интерфейсе, для ...
вопрос задан: 20 November 2010 21:53
0
ответов

Быстрый способ найти дубликаты в индексированном столбце в mongodb

У меня есть коллекция md5 в mongodb. Я хочу найти все дубликаты. Столбец md5 проиндексирован. Вы знаете какой-нибудь быстрый способ сделать это с помощью map reduce. Или мне просто перебрать все записи и ...
вопрос задан: 19 November 2010 12:05
0
ответов

Как проще всего объяснить, что такое Hadoop и Map / Reduce?

NoSQL очень легко объяснить с точки зрения высокого уровня - это, по сути, хранилище «ключ-значение». Конечно, с тысячей второстепенных и важных вещей, но в целом это просто хранилище ключевых значений. Что за ...
вопрос задан: 14 November 2010 18:32
0
ответов

В версии Google App Engine mapreduce для Python, как вы получаете доступ к счетчикам из done_callback?

Я использую mapreduce Google App Engine для анализа некоторых данных. Я создаю несколько счетчиков, из которых я хотел бы создать простую диаграмму Google в моем done_callback. Как мне получить доступ к полученным ...
вопрос задан: 25 October 2010 02:49
0
ответов

Действительно ли CouchDB разделяет представления по серверам?

В настоящее время я углубляюсь в CouchDB и озадачен распределением вычислений Map-Reduce в представлениях. Я вижу много ресурсов, в которых упоминается, что Map-Reduce по своей сути распределен, потому что вы ...
вопрос задан: 7 October 2010 06:30
0
ответов

Эквивалент хранимой процедуры MongoDB

У меня есть большой файл CSV, содержащий список хранилищ, У меня есть отдельная база данных MongoDB под названием ZipCodes, в которой хранятся широта и долгота для любого данного zip-архива ...
вопрос задан: 6 October 2010 19:09
0
ответов

Отображение / сокращение MongoDB в нескольких коллекциях?

Во-первых, предыстория. Раньше у меня были журналы сбора и я использовал map / reduce для создания различных отчетов. Большинство этих отчетов основывались на данных за один день, поэтому у меня всегда было условие ...
вопрос задан: 1 October 2010 08:27
0
ответов

MapReduce для нескольких типов хранилищ данных в Google App Engine

Я только что наблюдал за пакетной обработкой данных с помощью сеанса App Engine в Google I / O 2010, прочитал некоторые части статьи MapReduce из Google Research и теперь думаю использовать MapReduce на Google App Engine ...
вопрос задан: 24 September 2010 17:36
0
ответов

Scala-аналоги QtConcurrent

Какие аналоги QtConcurrent для Scala (или Java)? Т.е. упрощенная реализация MapReduce, параллельной карты и foldl. Спасибо
вопрос задан: 21 September 2010 17:28
0
ответов

Есть ли в Mongoid Map / Reduce?

Я использую код Ruby для вычисления суммы из массива, возвращаемого Mongoid. Но, возможно, использование Map / Reduce может быть быстрее, за исключением того, что я не вижу никаких документов для Map Reduce на mongoid.org и Google для карты ...
вопрос задан: 16 September 2010 00:02
0
ответов

Подстановочные знаки в представлениях с CouchDB?

Можно ли использовать подстановочные знаки в представлениях в CouchDB? Например, допустим, у меня есть база данных, в которой есть команды, возраст игроков, средние показатели игроков и пол игроков. Однако возраст игроков может ...
вопрос задан: 7 September 2010 01:58
0
ответов

Добавление нескольких файлов в распределенный кеш Hadoop?

Я пытаюсь добавить несколько файлов в hadoop распределенный кеш. На самом деле я не знаю имен файлов. Они будут названы как part-0000 *. Может кто-нибудь сказать мне, как это сделать? Спасибо Бала
вопрос задан: 3 September 2010 02:41