В чем преимущество файла последовательности Hadoop по сравнению с плоским файлом HDFS (Text )? Каким образом файл последовательности эффективен? Небольшие файлы можно объединять и записывать в файл последовательности, но то же самое можно...
Как HDFS хранит данные? Я хочу хранить огромные файлы в сжатом виде. Например: у меня есть файл размером 1,5 ГБ с коэффициентом репликации по умолчанию 3. Для этого требуется (1,5) * 3 = 4,5 ГБ места. Я ...
Namenode в архитектуре Hadoop - это единственная точка отказа. Как люди, у которых есть большие кластеры Hadoop, справляются с этой проблемой? Есть ли принятое в отрасли решение, которое сработало ...
Насколько я понимаю, сегментирование (например, в MongoDB) и распределенные файловые системы (например, HDFS в HBase или HyperTable) - это разные механизмы, которые базы данных используют для горизонтального масштабирования, однако мне интересно, как он
Я пытаюсь настроить версию Hadoop 0.20.203.0 в псевдораспределенной конфигурации, используя следующее руководство:http://www.javacodegeeks.com/2012/01/hadoop-modes-explained-standalone.htmlПосле...
Я использовал Hadoop в псевдораспределенном режиме и все такое. работал нормально. Но потом мне по какой-то причине пришлось перезагрузить компьютер. И теперь, когда я пытаюсь запустить Namenode и Datanode, я ...
Когда я настраиваю кластер hadoop, я читаю, что namenode работает на 50070, и я настраиваюсь соответственно, и он работает нормально. Но в некоторых книгах я встречал адрес узла имени: hdfs: // localhost: 9000 / ...
Я новичок в распределенной файловой системе Hadoop, я выполнил полную установку одного узла Hadoop на своем компьютере. Но после этого, когда я собираюсь загрузить данные в hdfs, он выдает сообщение об ошибке...
Я хочу получить доступ к hdfs с полностью определенными именами, такими как: hadoop fs -ls hdfs: // machine-name: 8020 / user. Я также могу просто получить доступ к hdfs с помощью hadoop fs -ls / user. Однако я пишу тестовые примеры ...
У меня есть Java-программа map-reduce, в которой я пытаюсь сжимать только вывод mapper, но не вывод reducer. Я думал, что это будет возможно, установив следующие свойства в ...
продолжает отображаться устаревшая ошибка Я установил hadoop -2.0.0 -alpha, но всякий раз, когда я выполняю команду, она выдает мне устаревшие ошибки (, хотя кажется, что она работает без проблем )$ hadoop/bin/hadoop dfs -copyFromLocal ввод...
Я создал небольшой кластер Hadoop для тестирования. Установка прошла довольно хорошо с NameNode (1 машина), SecondaryNameNode (1) и всеми DataNode (3). Машины названы "master", "secondary" и "...
Могу ли я разделить таблицу Hive при вставке по существующему полю ? У меня есть файл размером 10 ГБ с полем даты и полем часа дня. Могу ли я загрузить этот файл в таблицу, а затем вставить-перезаписать в другой ...
Я попытался определить, что означает высокая пропускная способность по сравнению с низкой задержкой в HDFS, и предложил следующее определение: HDFS оптимизирован для более быстрого доступа к пакетам данных (высокая ...
Предположим, что один из них использует размер блока по умолчанию (128 МБ), и есть файл, использующий 130 МБ; поэтому используется один полноразмерный блок и один блок размером 2 МБ. Затем к файлу необходимо добавить 20 МБ (всего ...
Я использую куст поверх EMR, и мне нужно скопировать некоторые файлы во все экземпляры EMR. Один из способов, насколько я понимаю, - это просто скопировать файлы в локальную файловую систему на каждом узле, другой - скопировать файлы в ...
В чем разница и смысл этих двух утверждений, с которыми я столкнулся во время лекции здесь :1. Традиционные базы данных применяют схему во время загрузки. и 2. Hive применяет схему во время...
Я совершенно новичок в Hadoop и только что закончил установку, которая заняла у меня 2 дня... Я сейчас пытаюсь с помощью команды hadoop dfs, но я просто не мог понять это, хотя я просматривал в течение нескольких дней, я...
В чем реальная разница между запуском скриптов PIG локально и на mapreduce? Я понимаю, что режим mapreduce — это когда вы запускаете его на кластере с установленным hdfs. Означает ли это, что локальный режим действительно...
Есть ли команда hdfs для просмотра свободного места в hdfs. Мы можем видеть это через браузер по адресу master :hdfsport в браузере, но по какой-то причине я не могу получить к нему доступ, и мне нужна какая-то команда. Я вижу...
У меня проблема с попыткой «загрузить» файл из файловой системы HDFS в мою локальную систему. (хотя обратная операция работает без проблем ). *Примечание :Файл существует в файловой системе HDFS на...
У меня есть настройка кластера Hadoop, и я работаю под общим именем пользователя по умолчанию «user1». Я хочу поместить файлы в hadoop с удаленного компьютера, который не является частью кластера hadoop. Я настроил хауп...
Это может показаться глупым вопросом, но в Hadoop предполагается, что размер блока равен X (, обычно 64 или 128 МБ ), а локальный размер файла равен Y (, где Y меньше X ). Теперь, когда я копирую файл Y в HDFS он будет потреблять...
из того, что я читал, HDFS работает быстро, потому что расслабляет некоторые приемы POSIX, но как это работает? или хотя бы какие? я не нашел ответа, потому что в гугле я нашел кого-то, перенаправляющего...
При разработке сценариев Pig, использующих команду STORE, мне приходится удалять выходной каталог для каждого запуска, иначе сценарий останавливается и предлагает: 2012-06-19 19:22:49,680 [main] ОШИБКА org.apache.pig.tools ....
Я новичок в Hadoop/PIG. У меня есть основной вопрос. Есть ли у нас средство ведения журнала в PIG UDF? Я написал UDF, который мне нужно проверить
Мне нужно зарегистрировать определенные операторы, чтобы проверить поток. Есть ли ...