Я новичок в Hadoop/PIG. У меня есть основной вопрос. Есть ли у нас средство ведения журнала в PIG UDF? Я написал UDF, который мне нужно проверить
Мне нужно зарегистрировать определенные операторы, чтобы проверить поток. Есть ли ...
У меня есть большая база данных Mongo (100 ГБ), размещенная в облаке (MongoLab или MongoHQ). Я хотел бы выполнить некоторые задачи Map/Reduce для данных, чтобы вычислить некоторую дорогостоящую статистику, и мне было интересно, что за ...
Я заметил, что существует два набора параметров конфигурации Hadoop: один с mapred.*, а другой с mapreduce.. Я предполагаю, что это может быть связано со старым API против нового API, но если я не ошибаюсь, ...
Все знают, что Pig поддерживает DBStorage, но они поддерживают только результаты загрузки из Pig в mysql, например STORE data INTO DBStorage('com.mysql.jdbc.Driver ', 'dbc:mysql://host/db', '...
У меня есть скрипт PIG, который выдает четыре результата
Я хочу сохранить их все в одном файле. Я пытаюсь использовать UNION, однако, когда я использую UNION, я получаю четыре файла part-m-00000, part-m-00001, part-m-00002, ...
Как с помощью Java составить список всех файлов (рекурсивно) по определенному пути в HDFS. Я зашел в API и заметил FileSystem.listFiles(Path,boolean), но похоже, что такого метода не существует...
У нас есть клиент BI, который ежемесячно генерирует около 40 миллионов строк в своих таблицах базы данных о продажах, созданных на основе их транзакций продаж. Они хотят создать витрину данных о продажах с помощью своих ...
Я написал сканер на C ++ и ищу распределенное хранилище данных, я нашел 2 1) hbase
2) гипертаблицы являются реализацией большой таблицы, и я только что рассмотрел гипертаблицу .. потому что она ...
Вызываются ли методы настройки и очистки в каждой задаче сопоставления и редьюсера соответственно? Или они вызываются только один раз в начале общих заданий картографа и редуктора?
что бы я ни делал, я не могу избавиться от этой ошибки. Я знаю, что snappy — это быстрая и, следовательно, предпочтительная библиотека сжатия/распаковки по сравнению с другими вариантами. Я хотел бы использовать эту библиотеку для своего...
Ek probeer hadoop onder windows gebruik en loop 'n probleem raak wanneer ek tasktracker wil begin. Byvoorbeeld: $ bin / start-all.sh dan skryf die logboeke: 2011-06-08 16: 32: 18,157 FOUT org ....
У меня возникли проблемы с установкой временной метки строки с помощью java API. Когда я пытаюсь добавить значение метки времени в конструктор put (или в put.add()), ничего не происходит, и после чтения строк из таблицы я получаю...
Я пытаюсь создать таблицу в улье с помощью java. Я обнаружил java.sql.SQLException: org.apache.thrift.transport.TTransportException при выполнении моего кода. Вот мой код public void createTable(...
Я хотел бы выполнить эквивалент «сохранить все a в A, где a.field == b.field для некоторого b в B» в Apache Pig. Я реализую это так: AB_joined = JOIN A по полю, B по полю;
A2 = ...
Мне нужно найти подключенные компоненты для огромного набора данных. (График ненаправленный) Одним из очевидных вариантов является MapReduce. Но я новичок в MapReduce, и у меня мало времени, чтобы разобраться с ним и написать код...
привет, я новичок в hbase и hadoop. Я не мог найти Вот почему мы используем Hadoop с hbase.Я знаю, что Hadoop — это файловая система, но я читал, что мы можем использовать hbase без Hadoop, так почему мы используем Hadoop?.. ,
Я просто пытаюсь подтвердить свое понимание разницы между редуктором 0 и редуктором идентичности. 0 редуктор означает, что шаг уменьшения будет пропущен, а вывод mapper будет окончательным выходом
Тождество...
Мой набор данных выглядит следующим образом: ( A, (1 ,2) )
( B, (2,9)) Я хотел бы «сгладить» кортежи в Pig, в основном повторяя каждую запись для каждого значения, найденного во внутреннем кортеже, так, чтобы...
Я работаю с Hadoop 0.20.2 и хотел бы объединить два файла в один с помощью команды оболочки -cat, если это возможно (источник: http://hadoop.apache.org/common/docs/r0.19.2/hdfs_shell .html) Вот...
я настроил кластер hbase для хранения данных из opentsdb. Недавно из-за перезагрузки некоторых узлов hbase потерял таблицу «tsdb». Я все еще могу это сделать на странице главного узла hbase, но когда я нажимаю на нее, она...
Предположим, я отслеживаю «событие», которое пользователь совершает на веб-сайте. Событиями могут быть такие вещи, как: просмотр главной страницы
добавил товар в корзину
проверить
оплаченный заказ Теперь каждое из этих событий хранится в базе данных...
Я не могу понять, как использовать фильтры в интерфейсе HBase REST (HBase 0.90.4-cdh3u3) . Документация просто дает мне определение схемы для «строки», но не показывает, как ее использовать. Итак, я ...
Когда я пытаюсь запустить свое задание, я получаю следующее исключение: Исключение в потоке "main" java.io.IOException: Mkdirs не удалось создать /some/path в org.apache.hadoop.util.RunJar.ensureDirectory(...
Я пытаюсь преобразовать простой рабочий процесс в oozie. Я пробовал просматривать примеры oozie, но они слишком -ошеломляющие. По сути, я хочу выполнить запрос и вывести результат в текст...
Я попытался запустить hadoop fs -getmerge в каталоге файлов.deflate. Результатом является сжатый файл на моей локальной машине. Как проще всего загрузить весь каталог в...
Я знаю, что мы можем установить свойство «mapred.job.reuse.jvm.num.tasks», чтобы повторно -использовать JVM. Мои вопросы::(1 )как определить количество задач, которые нужно установить здесь, -1 или какие-то другие положительные целые числа? (2 )это...
Я учусь в аспирантуре по информатике (интеллектуальный анализ данных и машинное обучение) и хорошо знаком с ядром Java (> 4 лет). Я прочитал кучу материалов по Hadoop и Map / Reduce. Теперь я хотел бы сделать ...
Я реализую кластер с одним узлом Hadoop на своем компьютере, следуя руководству Майкла Нолла, и столкнулся с ошибкой репликации данных :Вот полное сообщение об ошибке :> hadoop@laptop :~/...
Мы пытаемся использовать HBase для хранения данных временных рядов. В текущей модели временные ряды хранятся в виде версий в ячейке. Это означает, что в ячейке могут храниться миллионы версий, ...