3
ответа

Как использовать Карту Cassandra, Уменьшают с или w/o Свинья?

Кто-то может объяснить, как MapReduce работает с Cassandra.6? Я прочитал пример для подсчета количества слов, но я не вполне следую за тем, что происходит на конце Cassandra по сравнению с "клиентским" концом. https://svn....
вопрос задан: 29 April 2010 00:17
3
ответа

Различие между MapReduce и картой - уменьшает комбинацию в функциональном программировании

Я считал mapreduce по http://en.wikipedia.org/wiki/MapReduce, понял пример того, как получить количество "слова" во многих "документах". Однако я не понял следующую строку: Таким образом...
вопрос задан: 23 January 2010 21:14
3
ответа

Генерация Отдельных Выходных файлов в Потоковой передаче Hadoop

Только Используя картопостроитель (сценарий Python) и никакой редуктор, как я могу произвести отдельный файл с ключом как имя файла, для каждой строки вывода, вместо того, чтобы иметь долго файлы вывода?
вопрос задан: 26 October 2009 19:17
3
ответа

Каковы некоторые сценарии, для которых MPI лучше подходит, чем MapReduce?

Насколько я понимаю, MPI дает мне гораздо больше контроля над тем, как именно будут взаимодействовать разные узлы в кластере. В MapReduce / Hadoop каждый узел выполняет вычисления, обменивается данными с ...
вопрос задан: 7 October 2009 09:22
3
ответа

Разделение входа в подстроки у СВИНЬИ (Hadoop)

Предположите, что у меня есть следующий вход у Свиньи: некоторые И я хотели бы преобразовать это в: s так som некоторые я еще не нашел способ выполнить итерации по chararray на латыни свиньи. Я нашел МАРКИРОВАНИЕ...
вопрос задан: 9 September 2009 14:52
3
ответа

Потоковая передача данных и Hadoop? (не Hadoop, Передающий потоком)

Я хотел бы проанализировать непрерывный поток данных (получил доступ по HTTP), использование подхода MapReduce, таким образом, я изучал Apache Hadoop. К сожалению, кажется, что Hadoop ожидает запускать задание...
вопрос задан: 2 August 2009 00:24
3
ответа

Действительно ли возможно записать, отображают/уменьшают задания для Amazon Эластичный MapReduce с помощью.NET?

Действительно ли возможно записать, отображают/уменьшают задания для Amazon Эластичный MapReduce (http://aws.amazon.com/elasticmapreduce/) с помощью языков.NET? В особенности я хотел бы использовать C#. Предварительное исследование...
вопрос задан: 27 July 2009 21:20
3
ответа

Как алгоритм сортировки MapReduce работает?

Одним из основных примеров, который используется в демонстрации питания MapReduce, является сравнительный тест Terasort. Я испытываю затруднения при понимании основ алгоритма сортировки, используемого в MapReduce...
вопрос задан: 20 July 2009 10:07
3
ответа

CouchDB-.NET или моно эквивалентная технология

Есть ли какие-либо активные "основанные на документе" проекты базы данных с помощью.NET или Моно? Что-то подобное CouchDB, SimpleDB, LotusNotes, и т.д... Предпочтите открытый исходный код. Я полагаю, что технология JScript.NET могла быть...
вопрос задан: 13 January 2009 02:37
2
ответа

Стандартное отклонение с использованием mrjob в Python показывает, что у файла ошибки & ldquo; нет атрибутов для запуска & rdquo;

из mrjob.job import MRJob импорт статистики импорт sys класс MRFindStdev (): def mapper (self, _, line): для числа в line.split (','): yield number, float (number) def ...
вопрос задан: 3 March 2019 21:40
2
ответа

Карта Hadoop уменьшает: алгоритмы

Может кто-то указывать на меня на хороший веб-сайт с хорошим набором алгоритмов Hadoop. Например, самой сложной вещью, которую я могу сделать с Hadoop прямо сейчас, является Разряд Страницы. Кроме этого, я могу сделать...
вопрос задан: 14 December 2017 10:02
2
ответа

Запуск автономного приложения Hadoop на нескольких ядрах ЦП

Моя команда создала приложение Java с использованием библиотек Hadoop для преобразования куча входных файлов в полезный вывод. Учитывая текущую загрузку одного многоядерного сервера, все будет хорошо в течение следующего года или ...
вопрос задан: 23 May 2017 11:53
2
ответа

Выполненное задание Hadoop, не используя JobConf

Я не могу найти единственный пример представления задания Hadoop, которое не использует класс JobConf устаревший. JobClient, который не был удержан от использования, все еще только поддерживает методы, которые берут JobConf...
вопрос задан: 7 March 2016 02:28
2
ответа

Почему Apache Spark быстрее, чем Hadoop MapReduce [дубликат]

Я уже тестировал Apache Spark и Hadoop MapReduce с помощью TestDFSIO. Целью является тестирование производительности узкого места ввода-вывода в сети. Это приводит к тому, что Apache Spark работает быстрее, чем Hadoop. ...
вопрос задан: 16 August 2015 11:16
2
ответа

MapReduce Amazon никакое задание редуктора

Я пытаюсь создать картопостроитель только задание через AWS (задание потоковой передачи). Поле редуктора требуется, таким образом, я даю фиктивный исполняемый файл и добавляю-jobconf mapred.map.tasks=0 к полю Extra Args. В...
вопрос задан: 31 October 2013 03:55
2
ответа

Как исправить & ldquo; Задаче попытки_201104251139_0295_r_000006_0 не удалось сообщить о состоянии в течение 600 секунд. & Rdquo;

Я написал задание mapreduce для извлечения некоторой информации из набора данных. Набор данных - это рейтинг пользователей о фильмах. Количество пользователей составляет около 250 тыс., А количество фильмов около 300 тыс. Результатом карты является & ...
вопрос задан: 13 July 2012 01:30
2
ответа

Как я управляю именем выходных файлов и содержанием Hadoop, передающего задание потоком?

Существует ли способ управлять выходными именами файлов Hadoop Потоковая передача задания? Конкретно я хотел бы, чтобы содержание выходных файлов моего задания и имя были организованы кетом выводы редуктора - каждый файл...
вопрос задан: 24 May 2012 22:52
2
ответа

Отсортированный подсчет слов с помощью MapReduce Hadoop

Я очень плохо знаком с MapReduce, и я завершил пример Hadoop для подсчета количества слов. В том примере это производит неотсортированный файл (с парами "ключ-значение") подсчетов слов. Так это возможный отсортировать его по количеству...
вопрос задан: 7 March 2012 00:32
2
ответа

Альтернативы MapReduce

Существуют ли какие-либо альтернативы MapReduce (Google, Hadoop)? Есть ли другой разумный способ разделить и объединить большие проблемы?
вопрос задан: 1 January 2012 11:07
2
ответа

MapReduce на AWS

Кто-либо играл вокруг с MapReduce на AWS уже? Какие-либо мысли? Как реализация?
вопрос задан: 7 October 2011 18:01
2
ответа

MultipleOutputFormat в hadoop

Я - новичок в Hadoop. Я испытываю программу Wordcount. Теперь для испытания нескольких выходных файлов я использую MultipleOutputFormat., эта ссылка помогла мне в выполнении его. http://hadoop.apache.org/common/docs/...
вопрос задан: 16 August 2010 06:42
2
ответа

Я могу получить invidually отсортированные выводы Картопостроителя от Hadoop при использовании нулевых Редукторов?

У меня есть задание в Hadoop 0.20, который должен воздействовать на большие файлы по одному. (Это - шаг предварительной обработки для получения файловых данных в инструмент для очистки, основанный на строке формат, более подходящий для MapReduce.)...
вопрос задан: 25 June 2010 12:38
2
ответа

Нуждаюсь в помощи реализовывая этот алгоритм с картой MapReduce Hadoop

у меня есть алгоритм, который пройдет большой набор данных, читает некоторые текстовые файлы и ищут определенные условия в тех строках. Мне реализовали его в Java, но я не хотел к почтовому индексу так, чтобы это не делало...
вопрос задан: 7 June 2010 17:17
2
ответа

Как выбрать случайное (маленькое) демонстрационное использование данных, Отображают/Уменьшают?

Я хочу записать отобразить/уменьшить задание для выбора многих случайных выборок из большого набора данных на основе условия уровня строки. Я хочу минимизировать количество промежуточных ключей. Псевдокод: для каждого...
вопрос задан: 25 March 2010 08:48
2
ответа

Различия в распределении Hadoop

Может кто-то обрисовывать в общих чертах различные различия между различными доступными Дистрибутивами Hadoop: Cloudera - http://www.cloudera.com/hadoop Yahoo - http://developer.yahoo.net/blogs/hadoop/ с помощью...
вопрос задан: 11 September 2009 18:33
2
ответа

Существует ли библиотека MapReduce для Delphi?

Я недавно прочитал эту большую статью, которая кратко объясняет питание MapReduce Google: http://www.joelonsoftware.com/items/2006/08/01.html В Освоении Delphi 2009, Marco Cantu показывает мульти-...
вопрос задан: 4 August 2009 05:48
2
ответа

CouchDB: карта - уменьшает в Erlang

Как я могу записать, что карта - уменьшает функции в Erlang для CouchDB? Я уверен, что Erlang быстрее, чем JavaScript.
вопрос задан: 23 July 2009 08:25
2
ответа

Как MapReduce является хорошим методом проанализировать http журналы сервера?

Я смотрел на MapReduce некоторое время, и это, кажется, очень хороший способ реализовать отказоустойчивые распределенные вычисления. Я прочитал много газет и статей о той теме, установил Hadoop на...
вопрос задан: 2 June 2009 11:50
2
ответа

Карта и уменьшение в .NET

Какие сценарии оправдывают использование алгоритма «Map and Reduce»? Есть ли .NET-реализация этого алгоритма?
вопрос задан: 9 January 2009 16:44
1
ответ

Улей на спарк - почему не «выбрать *» Spawn Spark приложение / исполнителей?

Я установил Hive (v2.3.4) на Spark (exec engine). Это запускает приложение / исполнители spark: выберите count (*) из s.t, где h_code = 'KGD78' и h_no = '265' Почему это не запускает приложение spark / ...
вопрос задан: 29 March 2019 16:23