hadoop - список вопросов по программированию hadoop

0

ответов

Запрос двух связанных таблиц (Соединения)

Это первая таблица в Hive -. Она содержит информацию о предмете, который мы покупаем. СОЗДАЙТЕ ВНЕШНЮЮ ТАБЛИЦУ, ЕСЛИ НЕ СУЩЕСТВУЕТ Таблица 1 (Это ГЛАВНАЯ таблица, по которой необходимо проводить сравнения) (...

вопрос задан: 6 July 2012 22:44

0

ответов

Проблема с размером блока Hadoop и размером файла?

Это может показаться глупым вопросом, но в Hadoop предполагается, что размер блока равен X (, обычно 64 или 128 МБ ), а локальный размер файла равен Y (, где Y меньше X ). Теперь, когда я копирую файл Y в HDFS он будет потреблять...

hadoop hdfs

вопрос задан: 6 July 2012 20:05

0

ответов

Конфигурация медленного старта Hadoop

Каково идеальное значение для «mapred.reduce.slowstart.completed.maps» для задания Hadoop? Каковы правила, которым нужно следовать, чтобы установить его надлежащим образом? Спасибо!

hadoop

вопрос задан: 6 July 2012 19:56

0

ответов

MapReduce и SQL GROUP BY

Я пытался понять основы MapReduce в MongoDB, и даже после его реализации я не уверен, чем именно он отличается от GROUP BY в SQL или даже от собственной GROUP BY в Mongo. В SQL...

group-by hadoop mongodb mapreduce

вопрос задан: 6 July 2012 08:15

0

ответов

Установка количества задач карты и уменьшение количества задач

В настоящее время я выполняю задание. Я установил количество задач карты на 20, но получил большее число. Я также установил задачу уменьшения на ноль, но я все равно получаю отличное от нуля число. Общее время ...

hadoop mapreduce

вопрос задан: 4 July 2012 12:56

0

ответов

Сравнение инструментов рабочего процесса :Oozie и каскадирование

Я ищу инструмент рабочего процесса для запуска сложной карты -сокращения рабочих мест. Я имею в виду Oozie, но также хочу изучить Cascading. Есть ли какой-нибудь пример кода или пример, который связывает существующие задания M/R, используя...

cascading hadoop oozie mapreduce

вопрос задан: 3 July 2012 18:36

0

ответов

Hadoop java.io.IOException :при запуске формата namenode -

Я запустил формат namenode -. Это мой вывод. Я попытался изменить права доступа к файлу chmod 777 hadoop. Я считаю, что эта строка является ошибкой ERROR namenode.NameNode :java.io.IOException :Cannot create...

directory hadoop ioexception java-io

вопрос задан: 3 July 2012 16:58

0

ответов

Разделение кортежа на несколько кортежей в Pig

Мне нравится генерировать несколько кортежей из одного кортежа. Я имею в виду, что :у меня есть файл со следующими данными. >> данные кота ID | ИмяСтолбца1 :Значение1 | ColumnName2 :Value2, поэтому я загружаю его с помощью...

apache-pig hadoop

вопрос задан: 2 July 2012 18:54

0

ответов

В Hadoop где фреймворк сохраняет вывод задачи Map в обычном Map-Reduce приложении?

Я пытаюсь выяснить, где сохраняется вывод задачи Map на диск, прежде чем он может быть использован задачей Reduce. Примечание: - используется версия Hadoop 0.20.204 с новым API Например, когда ...

java hadoop mapreduce cluster-computing cloudera

вопрос задан: 2 July 2012 17:01

0

ответов

Лучшие практики Hadoop и MS SQL Server

Я слежу за Hadoop некоторое время, это кажется отличной технологией. Карта / уменьшение, кластеризация - это просто хорошие вещи. Но я не нашел ни одной статьи об использовании Hadoop с SQL Server. ...

sql database hadoop mapreduce cluster-computing

вопрос задан: 2 July 2012 11:10

0

ответов

кластерное генетическое программирование / алгоритмы

Недавно я пытался понять, можно ли использовать кластеры HADOOP для генетических алгоритмов / задач программирования. Я читал о hadoop и понимаю, что он может парализовать обработку ...

hadoop cluster-computing genetic-algorithm

вопрос задан: 2 July 2012 09:10

0

ответов

помещение удаленного файла в hadoop без его копирования на локальный диск

Я пишу сценарий оболочки, чтобы помещать данные в hadoop, как только они будут сгенерированы. Я могу подключиться к своему главному узлу по ssh, скопировать файлы в папку и затем поместить их в hadoop. Ищу...

copying hadoop piping ssh unix

вопрос задан: 30 June 2012 00:33

0

ответов

Почему существует ограничение на количество счетчиков, разрешенных в задании сокращения карты Hadoop?

Я использую Hadoop map-reduce и получаю исключение CountersExceededException, когда пытался программно создать множество счетчиков заданий. Я знаю, что могу увеличить количество разрешенных счетчиков с помощью ...

counter hadoop mapreduce

вопрос задан: 27 June 2012 19:05

0

ответов

Должны ли кластеры hadoop работать на идентичном оборудовании?

Помню, я где-то читал, что производительность Hadoop значительно ухудшается, если машины, на которых он работает, сильно отличаются друг от друга, но я больше не могу найти этот комментарий. Я...

hadoop

вопрос задан: 25 June 2012 17:42

0

ответов

NullPointerException от Hadoop JobSplitWriter/SerializationFactory при вызове InputSplit getClass()

Я получаю NullPointerException при запуске задания MapReduce. Он вызывается методом getSerializer() класса SerializationFactory. Я использую пользовательский InputSplit, InputFormat, RecordReader и...

hadoop java nullpointerexception mapreduce

вопрос задан: 25 June 2012 14:21

0

ответов

Разница между невыполненными задачами и убитыми задачами

В веб-интерфейсе Jobtracker я вижу этот столбец под названием «Не удалось/убито». Попытки задачи». Я хотел бы знать разницу между ними. Я думаю, что «Неудачные» означают задачи, которые в конечном итоге действительно провалились...

hadoop mapreduce

вопрос задан: 22 June 2012 23:40

0

ответов

Hadoop MultipleInputs завершается с ошибкой ClassCastException

Моя версия hadoop 1.0.3, когда я использую множественные входы, я получаю эту ошибку. java.lang.ClassCastException: org.apache.hadoop.mapreduce.lib.input.TaggedInputSplit не может быть приведен к org.apache.hadoop....

classcastexception hadoop

вопрос задан: 21 June 2012 16:26

0

ответов

Rails с Hadoop

У меня будет огромное количество данных для хранения, как у кореров для резюме, и я хотел бы рассмотреть Hadoop в качестве серверной части. Возможно ли использовать его с рубином на рельсах или просто нужно учитывать redis или mongodb. любой ...

hadoop ruby-on-rails

вопрос задан: 21 June 2012 10:59

0

ответов

Инструменты графического интерфейса разработчика и администратора для Hadoop

Может ли кто-нибудь дать совет по поводу каких-либо GUI-инструментов для разработки и администрирования Hadoop?

hadoop mapreduce

вопрос задан: 20 June 2012 20:30

0

ответов

Понимание LongWritable

Извините, если это глупый вопрос, но я не смог найти ответ с помощью поиска Google. Как я могу понять тип LongWritable? Что это такое? Может ли кто-нибудь дать ссылку на схему или другую полезную страницу.

hadoop java mapreduce

вопрос задан: 18 June 2012 15:51

0

ответов

Hadoop — Запись в HBase напрямую из Mapper

У меня есть задание Hadoop, вывод которого должен быть записан в HBase. Мне действительно не нужен редьюсер, тип строки, которую я хотел бы вставить, определяется в Mapper. Как я могу использовать TableOutputFormat для...

hadoop hbase java mapreduce

вопрос задан: 16 June 2012 10:38

0

ответов

Установить пользователя системы Hadoop для клиента, встроенного в веб-приложение Java

Я хотел бы отправить задания MapReduce из веб-приложения Java в удаленный кластер Hadoop, но не могу указать, какой пользователь работа должна быть представлена для. Я хотел бы настроить и использовать ...

cluster-computing hadoop

вопрос задан: 16 June 2012 10:12

0

ответов

Возможно ли иметь несколько входных данных с несколькими разными преобразователями в Hadoop MapReduce?

Возможно ли иметь несколько входных данных с несколькими разными преобразователями в Hadoop MapReduce? Каждый класс преобразователя работает с различным набором входных данных, но все они будут генерировать пары ключ-значение, потребляемые ...

hadoop mapreduce

вопрос задан: 16 June 2012 00:23

0

ответов

При использовании HBase в качестве источника для MapReduce можно ли расширить TableInputFormatBase, чтобы создать несколько разбиений и несколько преобразователей для каждого региона?

Я думаю об использовании HBase в качестве источника для одного из моих заданий MapReduce. Я знаю, что TableInputFormat указывает одно разделение ввода (и, следовательно, один преобразователь) для каждого региона. Однако это кажется неэффективным. Я'...

hadoop hbase java performance mapreduce

вопрос задан: 14 June 2012 18:54

0

ответов

Алгоритм распределенного локального коэффициента кластеризации (MapReduce/Hadoop)

Я реализовал алгоритм локального коэффициента кластеризации на основе парадигмы MapReduce. Однако я столкнулся с серьезными проблемами для больших наборов данных или определенных наборов данных (высокая средняя степень узла). Я ...

algorithm graph hadoop performance mapreduce

вопрос задан: 14 June 2012 13:42

0

ответов

Hadoop: Как работает OutputCollector во время MapReduce?

Я хочу знать, используется ли вывод «экземпляра» OutputCollector в функции карты: output.collect(ключ, значение) этот -выход- где-то хранит пары ключ-значение? даже если он излучает в редуктор ...

hadoop java mapreduce

вопрос задан: 14 June 2012 09:08

0

ответов

Значения редуктора Hadoop в памяти?

Я пишу задание MapReduce, которое может закончиться огромным количеством значений в редюсере. Я обеспокоен тем, что все эти значения загружаются в память одновременно. Использует ли базовая реализация...

hadoop mapreduce

вопрос задан: 13 June 2012 23:12

0

ответов

Hadoop: нет такого исключения метода

Я написал программу MapReduce, код приведен ниже: import java.io.IOException; импортировать java.util.Iterator; импортировать org.apache.hadoop.io.IntWritable; импортировать org.apache.hadoop.io.LongWritable; import org....

hadoop mapreduce

вопрос задан: 13 June 2012 20:28

0

ответов

Hadoop MapReduce: Соответствующий размер входных файлов?

У меня есть наборы данных величиной в 3 ГБ или даже 1 или 2 ТБ. Таким образом, входные файлы представляют собой список файлов, каждый размером около 10 ГБ. Моя работа по уменьшению карты в Hadoop обрабатывает все эти файлы и ...

file hadoop size mapreduce

вопрос задан: 13 June 2012 12:51

0

ответов

Восстановить таблицу HBase (неназначенный регион в процессе перехода)

Я немного застрял при восстановлении неисправной таблицы (на Hbase 0.92.1-cdh4.0.0, Hadoop 2.0.0 -cdh4.0.0) Существует незаконченный переходный регион: Состояние региона bf2025f4bc154914b5942af4e72ea063 ...

cloudera hadoop hbase

вопрос задан: 13 June 2012 07:35