0
ответов

Programmatically reading the output of Hadoop Mapreduce Program

This may be a basic question, but I could not find an answer for it on Google. У меня есть задание по уменьшению карты, которое создает несколько выходных файлов в своем выходном каталоге. Мое приложение Java выполняет эту работу ...
вопрос задан: 12 April 2011 14:15
0
ответов

В Hive, «Загрузить локальные данные в пути» перезаписывает существующие данные или добавляет их?

Я надеюсь запустить импорт в Hive на cron, и надеялся, что просто использовать «загрузить данные локально inpath '/ tmp / data / x' в таблицу X» в таблицу будет достаточно. Будут ли последующие команды перезаписаны ...
вопрос задан: 4 April 2011 23:09
0
ответов

Перемещение файлов в Hadoop с помощью Java API?

Я хочу перемещать файлы в HDFS с помощью API Java. Я не могу придумать, как это сделать. Кажется, что класс FileSystem только разрешает перемещение в локальную файловую систему и из нее ... но я хочу ...
вопрос задан: 31 March 2011 23:58
0
ответов

Как изменить имя таблицы ActiveRecord во время выполнения

Я меняю префикс table_name_prefix во время работы приложения rails (может показаться странным, но действительно вот чего хочу). Когда table_name_prefix изменяется для ActiveRecord, я сбрасываю таблицу ...
вопрос задан: 31 March 2011 00:00
0
ответов

Как я могу устранить эту ошибку установки файловой системы Hadoop?

Я пытаюсь установить Hadoop на тестовый образ Ubuntu, отличный от Cloudera. Кажется, все шло хорошо, пока я не запустил ./bin/start-all.sh. Узел имени никогда не появляется, поэтому я даже не могу запустить hadoop fs -...
вопрос задан: 24 March 2011 18:47
0
ответов

HDFS сообщает, что файл все еще открыт, но процесс записи в него был прерван

Я новичок в hadoop, и последние пару часов я провел, пытаясь найти эту проблему в Google , но я не нашел ничего, что могло бы помочь. Моя проблема в том, что HDFS сообщает, что файл все еще открыт, хотя процесс ...
вопрос задан: 18 March 2011 02:22
0
ответов

Как я могу определить, был ли уже отформатирован узел имени hadoop?

При настройке моего узла имени hadoop в первый раз я знаю, что нужно запустить bin / hadoop namenode -format, но запуск этого второй раз, после загрузки данных в HDFS, уничтожит все и ...
вопрос задан: 11 March 2011 20:04
0
ответов

Разница между 'distcp' и 'distcp -update'?

В чем разница между hadoop distcp и hadoop distcp -update Оба они будут выполнять одинаковую работу только с небольшая разница в том, как мы их называем. Ни один из них не перезаписывает уже ...
вопрос задан: 6 January 2011 13:37
0
ответов

Какой самый простой способ объединить небольшие блоки HDFS?

Я собираю журналы с Flume в HDFS. Для тестового примера у меня есть небольшие файлы (~ 300 КБ), потому что процесс сбора журналов был масштабирован для реального использования. Есть ли простой способ объединить эти ...
вопрос задан: 13 December 2010 14:08
0
ответов

Как эффективно копировать файлы из HDFS в S3 программно

Мое задание hadoop генерирует большое количество файлов в HDFS, и я хочу написать отдельный поток, который будет копировать эти файлы из HDFS в S3. Может ли кто-нибудь указать мне на какой-нибудь java API, который его обрабатывает. ...
вопрос задан: 14 September 2010 18:09