0
ответов

Интеграция Hive / HBase - Сеанс Zookeeper закрывается немедленно

У нас есть кластер из 8 узлов, использующий CDH3u2, настроенный с помощью Cloudera Manager. У нас есть выделенный главный узел, на котором запущен единственный экземпляр zookeeper. Когда я настраиваю hive для запуска локального hadoop, выполняется ...
вопрос задан: 6 February 2012 14:04
0
ответов

регулярное выражение для журнала доступа в улье serde

Я хочу извлечь (ip, requestUrl, timeStamp) из журналов доступа для загрузки в базу данных куста. Одна строка из журнала доступа выглядит следующим образом. 66.249.68.6 - - [14 / Янв / 2012: 06: 25: 03 -0800] «GET /example.com ...
вопрос задан: 1 February 2012 19:52
0
ответов

Как заставить улей одновременно запускать задания mapreduce?

Я новичок в улье и столкнулся с проблемой, у меня есть такая таблица в улье: create table td (id int, time string, ip string, v1 bigint, v2 int, v3 int, v4 int, v5 bigint, v6 int) ...
вопрос задан: 15 January 2012 07:24
0
ответов

hive regexp_extract weirdness

У меня проблемы с regexp_extract: я запрашиваю файл с разделителями табуляции, столбец, который я проверка имеет строки, которые выглядят следующим образом: abc.def.ghi Теперь, если я это сделаю: выберите отдельный ...
вопрос задан: 13 December 2011 22:26
0
ответов

В кластере hadoop, hive должен быть установлен на всех узлах?

Я новичок в Hadoop / Hive и только начал читать документацию. Есть много блогов об установке Hadoop в кластерном режиме. Также я знаю, что Hive работает поверх Hadoop. Мой вопрос: ...
вопрос задан: 10 December 2011 11:23
0
ответов

Как остановить конкретное задание при выполнении запросов Hive на Hadoop?

Сценарий: Когда я ввожу запрос в Hive CLI, я получаю следующие ошибки: Query: **$ bin/hive -e "insert overwrite table pokes select a.* from invites a where a.ds='2008-08-15'; "** Ошибка ...
вопрос задан: 2 December 2011 04:59
0
ответов

Проверить синтаксис Hive HQL?

Есть ли программный способ проверки операторов HiveQL на наличие таких ошибок, как базовые синтаксические ошибки? Я хотел бы проверить операторы перед отправкой их в Elastic Map Reduce, чтобы сохранить отладку ...
вопрос задан: 16 November 2011 17:13
0
ответов

Использование FileFormat v Serde для чтения пользовательских текстовых файлов

Новичок в Hadoop / Hive. Я пытаюсь использовать данные, хранящиеся в пользовательском текстовом формате с Hive. Насколько я понимаю, для этого вы можете написать собственный FileFormat или собственный класс SerDe. Есть ...
вопрос задан: 12 October 2011 01:01
0
ответов

как написать подзапрос и использовать предложение «In» в Hive

Как я могу использовать предложение In в Hive Я хочу написать что-то подобное в Hive выберите x из y, где yz в порядке (выберите отдельный z из y) by x; Но я не могу это сделать .. Я пробовал In ...
вопрос задан: 6 October 2011 16:16
0
ответов

Как Hive решает, когда использовать карту уменьшать, а когда нет?

В качестве простого примера, выберите * из таблички; НЕ БЫВАЙТЕ лягнуть в карту уменьшать, а выберите счет(*) из таблички; DOES. Какой общий принцип используется для принятия решения о том, когда использовать сокращение карты (по ульям)?....
вопрос задан: 19 September 2011 04:27
0
ответов

Как hive / hadoop гарантирует, что каждый модуль отображения работает с локальными для него данными?

2 основных вопроса, которые меня беспокоят: как я могу быть уверен, что каждый из 32 файлов, которые куст использует для хранения моих таблиц, находится на его уникальная машина? Если это произойдет, как я могу быть уверен, что если улей создает 32 ...
вопрос задан: 4 August 2011 12:56
0
ответов

В чем разница между СУБД и Hive? [закрыто]

В СУБД, такой как MySQL, есть база данных, есть ли база данных также в Улье? Как я читал в руководстве, в улье есть только таблица, я немного запутался в этом .. и в чем разница между концепцией СУБД и Улья? ...
вопрос задан: 2 August 2011 21:47
0
ответов

Hive не работает при установке

Я получаю следующую ошибку в Hive при выполнении любой команды. улей> показать таблицы; FAILED: ошибка в метаданных: javax.jdo.JDOFatalInternalException: обнаружено непредвиденное исключение. NestedThrowables: java ....
вопрос задан: 28 July 2011 02:18
0
ответов

запрос / агрегирование миллионов записей в реальном времени - hadoop? hbase? cassandra?

У меня есть решение, которое можно распараллелить, но у меня (пока) нет опыта работы с hadoop / nosql, и я не уверен, какое решение лучше всего подходит для моих нужд. Теоретически, если бы у меня было неограниченное количество процессоров, мои результа
вопрос задан: 26 July 2011 17:12
0
ответов

COLLECT_SET () в Hive, хранить дубликаты?

Есть ли способ сохранить дубликаты в собранном наборе в Hive или смоделировать совокупную коллекцию, которую предоставляет Hive, с помощью другого метод? Я хочу объединить все элементы в ...
вопрос задан: 22 June 2011 19:23
0
ответов

Hadoop Hive Query: Множественное объединение

Как я могу выполнять подвыборки в Hive? Я думаю, что могу совершить действительно очевидную ошибку, которая не так очевидна для меня ... Ошибка, которую я получаю: FAILED: Parse Error: строка 4: 8 не может распознать ввод '...
вопрос задан: 17 June 2011 22:10
0
ответов

Как лучше всего поддерживать типы столбцов массива с внешними таблицами в кусте?

Итак, у меня есть внешние таблицы данных с разделителями табуляции. Простая таблица выглядит так: создайте внешнюю таблицу, если категории не существует (строка идентификатора, строка тега, легальная строка, строка изображения, родительская строка, ..
вопрос задан: 7 June 2011 18:45
0
ответов

Поддержка клиента Python для запуска Hive поверх Amazon EMR

Я заметил, что ни mrjob Кроме того, boto не поддерживает интерфейс Python для отправки и выполнения заданий Hive в Amazon Elastic MapReduce (EMR). Существуют ли какие-либо другие клиентские библиотеки Python, которые поддерживают выполнение ...
вопрос задан: 23 May 2011 22:36
0
ответов

MDX support for Hive (Hadoop)

Is there any support for Multidimensional Expressions (MDX) for Hadoop's Hive ?
вопрос задан: 23 May 2011 06:27
0
ответов

Establishing a connection between R and a Hive (Hadoop) database

Does anyone know how to achieve that? I am assuming that RJDBC would help; but from my (likely naive) understanding, a bit of tweaking is necessary to write or adapt a Hive driver for this. Relevant ...
вопрос задан: 19 May 2011 11:24
0
ответов

Импорт данных из HDFS в таблицу Hive

У меня есть данные в файле data/2011/01/13/0100/file в HDFS, каждый из этих файлов содержит данные, разделенные табуляцией, скажем, имя, ip, url. Я хочу создать таблицу в Hive и импортировать данные из hdfs, таблица должна ...
вопрос задан: 22 April 2011 23:22
0
ответов

Любой хороший интерфейсный инструмент Opensource Analytics? [закрыто]

Есть ли какой-нибудь хороший веб-инструмент аналитики с открытым исходным кодом, который может обращаться к HIVE / HDFS за данными?
вопрос задан: 11 April 2011 22:27
0
ответов

В Hive, «Загрузить локальные данные в пути» перезаписывает существующие данные или добавляет их?

Я надеюсь запустить импорт в Hive на cron, и надеялся, что просто использовать «загрузить данные локально inpath '/ tmp / data / x' в таблицу X» в таблицу будет достаточно. Будут ли последующие команды перезаписаны ...
вопрос задан: 4 April 2011 23:09
0
ответов

Создать временную таблицу в Hive?

Поддерживает ли Hive временные таблицы? Я не могу найти его в документации по apache.
вопрос задан: 21 March 2011 23:59
0
ответов

Как преобразовать файл .txt в формат файла последовательности Hadoop

Чтобы эффективно использовать задания сокращения карты в Hadoop, мне нужны данные, которые должны храниться в формате файла последовательности hadoop. Однако в настоящее время данные представлены только в плоском формате .txt. Кто-нибудь может предложить
вопрос задан: 21 March 2011 12:24
0
ответов

Android: Как обновить селектор (StateListDrawable) программно

Я хочу обновить селектор для кнопки программно. Я могу сделать это с помощью XML-файла, который приведен ниже
вопрос задан: 23 February 2011 15:04
0
ответов

Строка для смещения в объекте c

У меня есть синтаксический анализатор, возвращающий некоторое строковое значение, которое я хотел бы использовать в качестве параметра для инициализации экземпляра моего класса. У меня есть метод, запрашивающий два NSString и значение с плавающей запятой
вопрос задан: 3 February 2011 00:33
0
ответов

Как перенести таблицу mysql в куст?

У меня есть большая таблица mysql, которую я хотел бы перенести в таблицу Hadoop / Hive. Существуют ли стандартные команды или методы для переноса простой (но большой) таблицы из Mysql в Hive? В таблице хранится ...
вопрос задан: 8 January 2011 05:24
0
ответов

Объединить несколько строк в одну строку через пробел

Таким образом, у меня есть 5 строк, как этот идентификатор пользователя, col -------------- 1, a 1, b 2, c 2, d 3, e Как бы я сделать запрос, чтобы он выглядел так ID пользователя, объединенный 1, ab 2, cd 3, e
вопрос задан: 16 September 2010 15:05
0
ответов

Spring-Batch для массовой ночной / почасовой обработки данных Hive / MySQL

I ' Я собираюсь заменить несколько сценариев Python ETL, которые выполняют еженедельную / почасовую сводку данных и сбор статистики для огромного количества данных. Чего я хотел бы добиться, так это Robustness - ...
вопрос задан: 16 August 2010 16:52