apache-pig - список вопросов по программированию apache-pig

18

ответов

Какой язык я мог использовать для быстрого выполнения этой задачи реферирования базы данных?

Таким образом, я записал программу Python для справлений с небольшой задачей обработки данных. Вот очень краткая спецификация на искусственном языке вычисления, которое я хочу: проанализируйте "%s %lf %s" aa bb cc | group_by aa |...

вопрос задан: 29 September 2009 18:34

4

ответа

Различие между Свиньей и Hive? Почему оба имеют? [закрытый]

Мое образование - 4 недели в мире Hadoop. Плескавшийся немного в Hive, Pig и Hadoop с помощью Hadoop VM Cloudera. Прочитали газету Google на MapReduce и GFS (ссылка PDF). Я понимаю это - Свинья...

hive hadoop apache-pig

вопрос задан: 5 January 2015 03:23

3

ответа

Справочник для [закрытой] латыни Свиньи Apache

Свинья является средой программирования потока данных для обработки очень больших файлов. Язык свиньи называют латынью Свиньи. Кто-либо знает о хорошем справочнике для PigLatin? Я ищу что-то это...

manual dataflow apache-pig

вопрос задан: 27 December 2016 02:46

3

ответа

Regexp, соответствующий у свиньи

Используя апачскую свинью и текст hahahah. мой брат просто не сделал ничего плохого. Он обманул по поводу теста?ни за что! Я пытаюсь соответствовать "своему брату, просто не сделал ничего плохого". Идеально, я хотел бы...

regex hadoop apache-pig

вопрос задан: 19 July 2010 21:42

3

ответа

Как использовать Карту Cassandra, Уменьшают с или w/o Свинья?

Кто-то может объяснить, как MapReduce работает с Cassandra.6? Я прочитал пример для подсчета количества слов, но я не вполне следую за тем, что происходит на конце Cassandra по сравнению с "клиентским" концом. https://svn....

mapreduce cassandra apache-pig

вопрос задан: 29 April 2010 00:17

3

ответа

Разделение входа в подстроки у СВИНЬИ (Hadoop)

Предположите, что у меня есть следующий вход у Свиньи: некоторые И я хотели бы преобразовать это в: s так som некоторые я еще не нашел способ выполнить итерации по chararray на латыни свиньи. Я нашел МАРКИРОВАНИЕ...

hadoop mapreduce apache-pig

вопрос задан: 9 September 2009 14:52

2

ответа

Pig Latin: загрузка нескольких файлов из диапазона дат (часть структуры каталога)

У меня есть следующие Сценарий - используется версия 0,70 Пример структуры каталогов HDFS: / пользователь / обучение / тестирование / 20100811 / <файлы данных> /user/training/...

hadoop apache-pig

вопрос задан: 26 August 2010 19:10

2

ответа

Объединение нескольких файлов в один в Hadoop

Я помещаю несколько маленьких файлов в мой входной каталог, который хочу объединить в один файл, не используя локальную файловую систему и не записывая mapreds. Есть ли способ, которым я мог бы сделать это, используя hadoof fs ...

hadoop apache-pig

вопрос задан: 23 August 2010 13:59

1

ответ

считая жанры у свиньи

mapreduce apache-pig

вопрос задан: 29 March 2019 12:35

1

ответ

Как предотвратить свидание Apache из пустых файлов?

У меня есть скрипт свиньи, который читает данные из каталога на HDFS. Данные хранятся как файлы avro. Структура файла выглядит так: DIR-- --Subdir1 --Subdir2 --Subdir3 --Subdir4 В свинье ...

apache-pig

вопрос задан: 13 July 2018 16:51

1

ответ

Ошибка выполнения команды оболочки в свинге

Поэтому я пытаюсь сделать что-то вроде:% DECLARE Variable `cat src / documents / item.json`; Поле фильтра BY = переменная; Но я получаю сообщение об ошибке: ERROR org.apache.pig.Main - java.lang ....

shell apache-pig

вопрос задан: 13 July 2018 07:30

1

ответ

Выдача исключения у свиньи EvalFunc UDF пропускают просто, что строка, или останавливаются полностью?

Мне записали Определяемую пользователем функцию (UDF) в Java для парсинга строк в файле журнала и информации о возврате назад свинье, таким образом, это может сделать всю обработку. Это выглядит примерно так: общедоступный краткий обзор...

hadoop apache-pig

вопрос задан: 29 March 2010 17:49

1

ответ

Храня данные к SequenceFile от Свиньи Apache

Свинья Apache может загрузить данные из файлов последовательности Hadoop с помощью PiggyBank SequenceFileLoader: РЕГИСТР/home/hadoop/pig/contrib/piggybank/java/piggybank.jar; ОПРЕДЕЛИТЕ SequenceFileLoader org.apache.pig....

hadoop apache-pig

вопрос задан: 10 March 2010 23:52

0

ответов

Как исправить ошибку Java несовместимого типа для KafkaWritable и Object

Я бегу сценарий свиньи, который использует класс Java. и во время выполнения сценария pig я получаю сообщение об ошибке: 1. несовместимые типы: org.apache.hadoop.hive.kafka.KafkaWritable не может быть преобразовано в org ....

java apache-pig

вопрос задан: 7 April 2019 15:33

0

ответов

разница между командами запуска и выполнения утилиты в pig

Команда Apache Pig Utility дает два одинаковых типа команд run и exec для запуска pig-сценария в grunt shell, я смотрю, разница только в том, что run дает гибкость разработчику при взаимодействии

hadoop apache-pig hadoop2

вопрос задан: 15 January 2019 18:51

0

ответов

Загрузка данных в CSV-файл в HBase с использованием Pig

Я пытаюсь загрузить один CSV-файл в таблицу HBase. Я могу успешно сбросить данные из CSV, но при импорте в таблицу я получаю сообщение об ошибке. Но, при загрузке других данных, я могу загрузить любой ...

loading apache-pig hive

вопрос задан: 31 December 2018 17:05

0

ответов

strsplit issue - Pig

I have following tuple H1 and I want to strsplit its $0 into tuple.However I always get an error message: DUMP H1: (item32;item31;,1) m = FOREACH H1 GENERATE STRSPLIT($0, ";", 50); ERROR 1000: ...

apache-pig

вопрос задан: 31 October 2018 15:45

0

ответов

Фильтровать строку на основе слова

У меня есть работа свиньи, где мне нужно отфильтровать данные, находя слово в нем, вот фрагмент a = load '/ home / user / filename' Используя поросяту (','); B = Foreach A Generate $ 27, $ 38; C = Фильтр B по ...

hadoop apache-pig

вопрос задан: 1 October 2018 18:36

0

ответов

ERROR org.apache.pig.tools.grunt.Grunt - org.apache.pig.tools.pigscript.parser.TokenMgrError: Непревзойденный '}'

Я пытаюсь сохранить HDFS с помощью метода AvroStorage (). Код выглядит так: хранить «данные» в «путь» с помощью AvroStorage («схема», $ SCHEMA) SCHEMA - это переменная, которую я получаю от выполнения cat '/ path / to / ...

apache-pig avro

вопрос задан: 13 July 2018 20:50

0

ответов

Использование предложения IN с PIG FILTER

Поддерживает ли PIG предложение IN? filter = ФИЛЬТР bba ПО причине не в ('a', 'b', 'c', 'd'); или я должен разделить его на несколько операционных? Спасибо!

apache-pig

вопрос задан: 31 May 2017 11:00

0

ответов

Как разделить таблицу с помощью HIVE?

Я играю с Hive уже несколько дней, но у меня все еще есть проблемы с разделением. Я записываю журналы Apache (формат Combine) в Hadoop в течение нескольких месяцев. Они хранятся в текстовом формате строки,...

hadoop mapreduce hive apache-pig

вопрос задан: 23 May 2017 12:06

0

ответов

Как Pig использует Hadoop Globs в ' load '?

Как я отмечал ранее, Pig плохо справляется с пустыми (0-байтовыми) файлами. К сожалению, существует множество способов создания этих файлов (даже в служебных программах Hadoop). Я думал, что я ...

hadoop apache-pig

вопрос задан: 23 May 2017 12:00

0

ответов

Использование Pig / Hive для обработки данных вместо кода сокращения прямой карты Java?

(Даже более простой, чем разница между Pig и Hive? Почему оба?) У меня есть конвейер обработки данных, написанный в нескольких задачах Java по сокращению карты через Hadoop (мой собственный код, полученный из Hadoop '...

hadoop mapreduce hive apache-pig

вопрос задан: 23 May 2017 11:50

0

ответов

Выполнение запроса Pig по данным, хранящимся в Hive

Я хотел бы знать, как выполнять запросы Pig, хранящиеся в формате Hive. Я настроил Hive для хранения сжатых данных (с помощью этого руководства http://wiki.apache.org/hadoop/Hive/CompressedStorage). Перед ...

hadoop apache-pig hive

вопрос задан: 23 May 2017 11:45

0

ответов

Рабочий поток свиньи в Хадооп 2.2 Свинья 0,12,1 в 4.1.0

Я пытаюсь выполнить рабочий процесс свиньи. Но рабочий процесс зависает в рабочем состоянии, я проверил файл журнала, я нашел этот файл журнала от менеджера узлов: 2015-02-25 17: 50: 06,322 [JobControl] INFO ...

oozie apache-pig hadoop

вопрос задан: 25 February 2015 17:29

0

ответов

PigUnit с Hadoop 2.x

Я пытаюсь использовать PigUnit с Hadoop 2.4.1. У меня есть очень простой сценарий Pig, который я хочу выполнить внутри PigTest, но когда я запускаю этот тест, я получаю следующее исключение: java.lang ....

apache-pig classpath intellij-idea hadoop java

вопрос задан: 25 February 2015 03:41

0

ответов

Какой лучший плагин Pig для Eclipse?

Я собираюсь начать экспериментировать с PIG-latin и надеялся получить подсветку текста и тому подобное в Eclipse . Выполнив быстрый поиск в Google, я нашел для него несколько плагинов Eclipse. Есть ...

eclipse eclipse-plugin editor apache-pig

вопрос задан: 6 July 2014 10:07

0

ответов

В чем разница между Apache Pig и Apache Hive?

В чем точная разница между свиньей и ульем? Я обнаружил, что оба имеют одинаковое функциональное значение, потому что они используются для выполнения одной и той же работы. Единственное, это реализация, которая отличается для...

apache-pig bigdata hadoop hive

вопрос задан: 18 March 2013 22:54

0

ответов

Как добавить номера строк для строк в PIG или HIVE?

У меня проблема при добавлении номеров строк с помощью Apache Pig. Проблема в том, что у меня есть столбец STR_ID, и я хочу добавить столбец ROW_NUM для данных в STR_ID, который является номером строки STR_ID. ...

hadoop hive apache-pig

вопрос задан: 7 January 2013 21:31

0

ответов

Разница между локальным режимом PIG и режимом mapreduce

В чем реальная разница между запуском скриптов PIG локально и на mapreduce? Я понимаю, что режим mapreduce — это когда вы запускаете его на кластере с установленным hdfs. Означает ли это, что локальный режим действительно...

apache-pig hadoop hdfs mapreduce

вопрос задан: 26 July 2012 12:33