Это - концептуальный вопрос, включающий Hadoop/HDFS. Позволяет говорят, что у Вас есть файл, содержащий 1 миллиард строк. И ради простоты, позволяет, полагают, что каждая строка имеет форму <k, v> где...
Я изучаю Hadoop, и я правильно установил кластер Hadoop узла (версия: 2.7.3) на моем Mac. Я уже загрузил несколько текстовых файлов в свой HDFS, и сегодня, когда я пытаюсь создать новый каталог ...
Помогите мне понять разницу между пространством имен и метаданными. Что такое содержимое, находящееся в пространстве имен и использование пространства имен
У меня есть файл, который содержит сериализованные объекты Java как "Вектор". Я хранил этот файл по Распределенной файловой системе Hadoop (HDFS). Теперь я намереваюсь считать этот файл (использующий метод readObject) в одном из...
Я настроил sigle-узел конфигурация Hadoop, работающая через cygwin под Win7. После запуска Hadoop bybin/start-all.sh я выполняю bin/hadoop DFS-ls, который возвращает меня список файлов в моем hadoop каталоге...
Делает у любого есть любое знакомство с работой и с CloudStore и с HDFS. Мне интересно видеть, как далеко CloudStore масштабировался и как в большой степени он использовался в производстве. CloudStore кажется...
Sentry не может отправить полный снимок изображения из списка контроля доступа к таблице HIVE в HDFS, так что ACL HDFS и ACL таблицы кустов не синхронизируются. Я использую Clouder CDH 5.14.2, который содержит часового ...
У нас есть особое требование проверять / проверять данные в движении, когда зашифрованные RPC потоки данных для всей связи с клиентом, а также внутри больших компонентов данных, таких как HBase / Phoenix / HDFS / YARN / Hive ...
Можно ли восстановить папку, удаленную с помощью -skipTrash. Мы остановили hdfs через 5 минут после. Наш кластер находится в режиме HA, и мы не понимаем, как мы можем использовать файл fsimage для восстановления. Мы пытались использовать эти руководства и
У меня есть 8 подчиненных узлов и 1 мастер-узел. До недавнего времени только подчиненные узлы были частью моей настройки HDFS. Однако, в последнее время, главный узел тоже появился там с диском, который намного меньше. ...
Ниже приведено сообщение об ошибке: Невозможно переместить источник hdfs: //sandbox-hdp.hortonworks.com: 8020 / user / maria_dev / DimDepartmentGroup / part-m-00000 в место назначения hdfs: //sandbox-hdp.hortonworks.com: 8020 / ...
У меня проблемы с запуском hdfs. Мой кластер состоит из 3 узлов на облачной платформе Google. 1 - активный наменоде. Предполагается, что узел 2 будет резервным наменодом и датододом. Узел 3 - это просто датанода. ...
Мы создали планировщик, который извлекает данные с сервера sql в помещении и помещает их в HDFS. Теперь проблема в том, что нам нужно проверить, правильно ли переданы данные и соответствуют ли они ...
Я запускаю скрипт bash на MIT Supercloud. Скрипт запрашивает ресурсы, используя SLURM. В данном случае это 2 узла, один из которых является ведущим, а другой - ведомым. Вот мой скрипт bash для настройки ...
Позвольте мне объяснить сценарий. У меня есть два наменода. Один будет представлять маркетинговую команду, а другой - отдел продаж. Можно ли выделить место в соответствии с нашими потребностями. Могу ли я выделить 70% ...
Я пытаюсь выяснить диаграмму, на которой показан поток заданий MapReduce в случае операции записи (например, в hive INSERT INTO tablename select * from temptable). В Hadoop Definitive Guide ...
Я использую Liferay 7.1.1 GA2. В настоящее время эта версия Liferay не поддерживает HDFS в качестве хранилища документов, как описано в https: //dev.liferay.com/discover/deployment / - / Knowledge_base / 7-1 / document -...
По сути, это вопрос дизайна, который у меня есть. Ищете наиболее эффективный способ выполнить это. Вот сценарий .... У нас есть три части данных. Это: DATASET 1 (HDFS) (первичный ключ: ...
Есть ли что-нибудь, что я могу открыть файлы в HDFS в редакторе, таком как Sublime или Notepad ++, например, использовать клиенты, такие как filezilla или MobaXterm
Используя Apache Spark 1.6.4, с плагиномasticsearch4hadoop, я экспортирую индекс эластичного поиска (100 млн документов, 100Go, 5 осколков) в сжатый файл партера в HDFS 2.7. Я запускаю этот ETL как ...
Если я скопирую данные из локальной системы в HDFS, Могу ли я быть уверен, что он равномерно распределен по узлам? PS HDFS гарантирует, что каждый блок будет храниться на 3 разных узлах. Но означает ли это, что ...
У меня есть папка в hdfs, в которой есть две подпапки, каждая из которых имеет около 30 подпапок, каждая из которых, наконец, содержит файлы xml. Я хочу перечислить все файлы xml, указав только путь к основной папке. Локально я...
У меня есть набор данных excel, который загружается в hdfs, используя представления Ambari. Я мог бы найти путь к чему-то вроде: '/org/dir1/dir2/DATA/LKUP_AAL_PeakOut_By_Zip_WS.xlsx' Я работаю над ...
Я хотел бы знать, как найти соответствие между таблицами Hive и фактическими файлами HDFS (или, скорее, каталогами), которые они представляют. Мне нужен прямой доступ к файлам таблиц. Где хранится Hive ...
Когда я подключил свой кластер Hadoop к хранилищу Amazon и загрузил файлы в HDFS, я обнаружил, что s3: // не работает. При поиске помощи в Интернете я обнаружил, что могу использовать S3n. Когда я использовал S3n это ...
Я новичок в hadoop.
У меня есть задание MapReduce, которое должно получать входные данные из Hdfs и записывать выходные данные редуктора в Hbase. Я не нашел хорошего примера. Вот код, ошибка ...
Я хочу выполнить некоторые вычисления с помощью hadoop и mahout на моем четырехъядерном компьютере, поэтому я использую hadoop в псевдораспределенном режиме . Проблема в том, что место на моем корневом драйвере ограничено, так как же ...