hadoop - список вопросов по программированию hadoop

0

ответов

Получите sysdate -1 в Hive

Есть ли способ получить текущую дату -1 в Hive всегда означает вчерашнюю дату? И в этом формате -20120805? Я могу запустить свой запрос таким образом, чтобы получить данные для вчерашней даты, так как сегодня 6 августа -...

вопрос задан: 7 August 2012 02:28

0

ответов

Передача даты в качестве аргументов командной строки в Hive

У меня есть запрос ниже в файле test1.hql. Я пытаюсь передать дату (dt )в качестве аргумента командной строки. выберите *из губ _данные _качество, где dt = '${hiveconf :start _date}'; Поэтому всякий раз, когда я пытаюсь бежать...

hadoop hive mapreduce

вопрос задан: 4 August 2012 18:48

0

ответов

Эффективное хранение данных в Hive

Как я могу эффективно хранить данные в Hive, а также хранить и извлекать сжатые данные в Hive? В настоящее время я храню его как TextFile. Я просматривал статью Bejoy и обнаружил, что LZO...

hadoop hive mapreduce lzo

вопрос задан: 3 August 2012 17:31

0

ответов

Hadoop :java.lang.ClassCastException :org.apache.hadoop.io.LongWritable нельзя преобразовать в org.apache.hadoop.io.Text

Моя программа выглядит как общедоступный класс TopKRecord extends.Text> { public void map (Текстовый ключ,...

hadoop java mapreduce

вопрос задан: 2 August 2012 19:48

0

ответов

Hive применяет схему во время чтения?

В чем разница и смысл этих двух утверждений, с которыми я столкнулся во время лекции здесь :1. Традиционные базы данных применяют схему во время загрузки. и 2. Hive применяет схему во время...

hadoop hive hdfs mapreduce

вопрос задан: 1 August 2012 17:13

0

ответов

Hive QL -Ограничение количества строк для каждого элемента

Если у меня есть несколько элементов, перечисленных в предложении where, как можно ограничить результаты до N для каждого элемента в списке? EX :выберите a _id,b,c, count (*), как sumrequests из таблицы _имя куда а _идентификатор...

hadoop hive hiveql hql

вопрос задан: 31 July 2012 23:13

0

ответов

Где используется Sort на этапе MapReduce и почему?

Я новичок в хаупе здесь. Непонятно, зачем нам нужна возможность сортировки по ключам при использовании hadoop mapreduce? После этапа карты нам нужно распределить данные, соответствующие каждому уникальному ключу, на некоторые...

hadoop mapreduce

вопрос задан: 31 July 2012 18:05

0

ответов

Hadoop: невозможно использовать команду Jps

Проблема в hduser @ saket-K53SM: / usr / local / hadoop $ jps. Программу 'jps' можно найти в следующих пакетах: * openjdk-6-jdk * openjdk-7-jdk Попробуйте: sudo apt-get install < выбрано ...

hadoop java

вопрос задан: 31 July 2012 15:47

0

ответов

Где хранятся мои файлы (dir ), когда я использовал Hadoop fs -mkdir?

Я совершенно новичок в Hadoop и только что закончил установку, которая заняла у меня 2 дня... Я сейчас пытаюсь с помощью команды hadoop dfs, но я просто не мог понять это, хотя я просматривал в течение нескольких дней, я...

hadoop hdfs

вопрос задан: 30 July 2012 03:03

0

ответов

Плагин не найден в репозитории плагинов -Как решить проблему, когда Nexus моей компании не работает?

Я пытаюсь собрать Hadoop локально, и когда я делаю $ mvn -U clean install -Pdist -Dtar -Ptest -patch, как уже упоминалось -http://wiki.apache.org/hadoop/HowToSetupYourDevelopmentEnvironment[ERROR] Ошибка...

hadoop java nexus maven

вопрос задан: 29 July 2012 06:42

0

ответов

как выбрать данные из улья с определенным разделом?

каждый. вот взаимодействие с ульем :hive> показать разделы TABLENAME pt=2012.07.28.08/_завершено=1 pt=2012.07.28.09/_завершено=1 pt=2012.07.28.10/_завершено=1 пт=2012.07.28.11/...

hadoop hive

вопрос задан: 28 July 2012 10:17

0

ответов

как установить путь к классам для программы Java в файловой системе hadoop

Я пытаюсь понять, как установить путь к классу, который ссылается на HDFS? Я не могу найти никакой ссылки. java -cp "как ссылаться на HDFS?" com.MyProgram Если я не могу сослаться на файловую систему hadoop,...

classpath hadoop java

вопрос задан: 28 July 2012 05:32

0

ответов

Разница между локальным режимом PIG и режимом mapreduce

В чем реальная разница между запуском скриптов PIG локально и на mapreduce? Я понимаю, что режим mapreduce — это когда вы запускаете его на кластере с установленным hdfs. Означает ли это, что локальный режим действительно...

apache-pig hadoop hdfs mapreduce

вопрос задан: 26 July 2012 12:33

0

ответов

Ошибка при запуске Hadoop Job Tracker

Я попытался запустить простую программу в Hadoop с помощью Windows-Cygwin. Я могу запустить namenode. Однако запуск джобтрекера завершается с ошибкой :FATAL mapred.JobTracker:java.lang....

hadoop

вопрос задан: 25 July 2012 21:36

0

ответов

Задание Hadoop :работает нормально на меньшем наборе данных, но не работает с большим набором данных

У меня следующая ситуация: у меня есть кластер из 3 машин со следующей конфигурацией. Основное использование / :91,4% от 74,41 ГБ MemTotal :16557308 кБ MemFree :723736 КБ Ведомый 01...

hadoop-streaming hadoop java mapreduce

вопрос задан: 22 July 2012 16:40

0

ответов

Как узнать размер файла HDFS

Как узнать размер файла HDFS? Какую команду следует использовать, чтобы узнать размер любого файла в HDFS.

hadoop hdfs

вопрос задан: 21 July 2012 17:03

0

ответов

Доступно свободное пространство HDFS

Есть ли команда hdfs для просмотра свободного места в hdfs. Мы можем видеть это через браузер по адресу master :hdfsport в браузере, но по какой-то причине я не могу получить к нему доступ, и мне нужна какая-то команда. Я вижу...

hadoop hdfs

вопрос задан: 20 July 2012 05:16

0

ответов

Зачем объявлять классы Mapper и Reducer статическими?

Это, вероятно, свидетельствует о том, что я не понимаю Java, но мне интересно, почему в большинстве программ MapReduce классы картографа и редуктора объявлены как статические?

hadoop java mapreduce

вопрос задан: 19 July 2012 23:15

0

ответов

Поиск в документах, хранящихся в Hadoop -Какой инструмент использовать?

Я потерялся в :Hadoop, Hbase, Lucene, Carrot2, Cloudera, Tika, ZooKeeper, Solr, Katta, Cascading, POI... Когда вы читаете об одном, вы часто можете быть уверены, что каждый из других инструментов будет...

carrot2 cloudera hadoop solr lucene

вопрос задан: 18 July 2012 18:53

0

ответов

Hadoop в псевдо-распределенном режиме. В соединении отказано

P.S :Пожалуйста, не отмечайте это как дубликат. Привет, я пытался настроить и запустить Hadoop в псевдораспределенном режиме. Когда я запускаю скрипт start -all.sh, я получаю этот вывод :start namenode,...

hadoop ssh ubuntu

вопрос задан: 15 July 2012 13:59

0

ответов

Копирование файла из HDFS на локальный компьютер

У меня проблема с попыткой «загрузить» файл из файловой системы HDFS в мою локальную систему. (хотя обратная операция работает без проблем ). *Примечание :Файл существует в файловой системе HDFS на...

hadoop java hdfs

вопрос задан: 13 July 2012 13:23

0

ответов

Установка PIG на одном узле

Я установил Hadoop (1.0.2 )для одного узла в Windows 7 с Cygwin, и он работает. Однако я не могу заставить PIG (0.10.0 )увидеть Hadoop. 1 )«Ошибка :JAVA _ГЛАВНАЯ не установлена». Я добавил эту строку в...

apache-pig hadoop

вопрос задан: 13 July 2012 11:46

0

ответов

Ошибка Hbase mapreduce

Я пишу задание mapreduce. Вход представляет собой таблицу в hbase. При выполнении задания произошла ошибка :org.apache.hadoop.hbase.client.ScannerTimeoutException :88557 мс с момента последнего вызова, время ожидания...

hadoop hbase

вопрос задан: 13 July 2012 02:45

0

ответов

Документация Hadoop для Eclipse

Недавно я установил Hadoop и могу запускать простые программы. Однако я хотел бы просмотреть документацию по классам Hadoop в браузере Javadoc в Eclipse. Пожалуйста, дайте мне знать, как включить это...

hadoop javadoc eclipse

вопрос задан: 13 July 2012 02:31

0

ответов

как убить работу Hadoop

Я хочу автоматически уничтожать все свои задания хаупа, когда мой код сталкивается с необработанным исключением. Мне интересно, как лучше всего это сделать? Спасибо

hadoop jobs kill

вопрос задан: 12 July 2012 09:04

0

ответов

Как получить имя входного файла в MRjob

Я пишу функцию карты, используя mrjob. Мой ввод будет поступать из файлов в каталоге на HDFS. Имена файлов содержат небольшую, но важную информацию, которой нет в самих файлах. Есть...

hadoop-streaming hadoop mrjob python

вопрос задан: 11 July 2012 14:26

0

ответов

ListFiles из кластера HDFS

Я любитель с хаупом и прочим. Теперь я пытаюсь получить доступ к кластеру Hadoop (HDFS )и получить список файлов из клиентского eclipse. Я могу выполнять следующие операции после настройки...

hadoop java

вопрос задан: 9 July 2012 11:16

0

ответов

Взорвать массив Struct в Hive

Это приведенная ниже таблица Hive CREATE EXTERNAL TABLE IF NOT EXISTS SampleTable (ПОЛЬЗОВАТЕЛЬ _ID БОЛЬШОЙ, NEW _ПУНКТ МАССИВ> )А это данные в...

hadoop hive hiveql mapreduce

вопрос задан: 7 July 2012 21:14

0

ответов

Почему отправка задания на mapreduce занимает так много времени?

Таким образом, обычно для кластера из 20 узлов отправка задания на обработку 3 ГБ (200 разбиений )данных занимает около 30 секунд, а фактическое выполнение — около 1 минуты. Я хочу понять, что является узким местом в процессе отправки вакансий...

hadoop mapreduce

вопрос задан: 7 July 2012 00:18

0

ответов

Как указать имя пользователя при размещении файлов на HDFS с удаленного компьютера

У меня есть настройка кластера Hadoop, и я работаю под общим именем пользователя по умолчанию «user1». Я хочу поместить файлы в hadoop с удаленного компьютера, который не является частью кластера hadoop. Я настроил хауп...

hadoop username hdfs

вопрос задан: 7 July 2012 00:10