4
ответа

Почему ORC-таблица извлекает вставленные данные, но не загружает данные в куст [duplicate]

Я создаю одну таблицу как формат файла ORC и вставляю данные: hive & gt; создать таблицу test1 (id int, строку имени), хранящуюся как ORC; Улей & GT; вставить в значения test1 (1, «Riyaz»); Улей & GT; вставлять в ...
вопрос задан: 6 January 2015 15:11
4
ответа

Передача Класса <T> в Java универсального списка?

У меня есть метод для чтения JSON от сервиса, я использую Gson, чтобы сделать мою сериализацию и записал следующий метод с помощью параметров типа. общедоступный T getDeserializedJSON (класс А Класса <T>...
вопрос задан: 9 May 2010 14:23
2
ответа

Как получить количество всех записей и других записей в одном запросе

У меня есть следующий запрос выбора имени, trip_id из основного порядка по имени. Я хочу получить количество всех записей и всех столбцов в таблицах. Например, если у меня есть 200 строк в таблице, я хочу ...
вопрос задан: 23 February 2019 19:17
2
ответа

SQL Join :: Выборка записей вне условия соединения

У меня есть 2 таблицы A и B A B Требование состоит в том, чтобы объединить обе таблицы, используя столбец идентификатора, и, кроме того, если значение выбранного имени имеет другую запись с другим идентификатором, эта запись должна ...
вопрос задан: 16 January 2019 19:14
2
ответа

Вставка файла фиксированной ширины в Hive с использованием scala spark

У меня есть пример записи файла, подобный этому 2018-01-1509.05.540000000000001000000751111EMAIL@AAA.BB.CL, и вышеупомянутая запись взята из файла с фиксированной длиной, и я хотел разбить на основе длин и когда я ...
вопрос задан: 13 July 2018 10:58
1
ответ

Uive UDF с приращением даты

Я пытаюсь написать пользовательскую функцию, которая позволит вам ввести дату (current_date) и диапазон, и запрос вернет следующие даты вместе с тем, сколько дат прошло. Как ...
вопрос задан: 26 June 2019 23:21
1
ответ

Как преобразовать дату в строку в формате ГГГГММДД?

У меня есть дата в файле с этим форматом: вс 28 января 01:00:22 2018, но мне нужно преобразовать ее в формат ГГГГММДД, чтобы дата использовалась в качестве раздела. Я пытался использовать эту команду, но возвращение ...
вопрос задан: 31 March 2019 02:37
1
ответ

Улей на спарк - почему не «выбрать *» Spawn Spark приложение / исполнителей?

Я установил Hive (v2.3.4) на Spark (exec engine). Это запускает приложение / исполнители spark: выберите count (*) из s.t, где h_code = 'KGD78' и h_no = '265' Почему это не запускает приложение spark / ...
вопрос задан: 29 March 2019 16:23
1
ответ

Hive Query: рассчитать максимальное значение индикатора на основе приоритета и даты

Я пытался сформулировать запрос, но каким-то образом не получил требуемый результат, поэтому отправил Я новичок в улье. Извиняюсь, если это очень просто. Исходные данные: Ik - приоритет - ind1 - ind2 - дата 1 - A - ...
вопрос задан: 26 March 2019 19:19
1
ответ

считать отдельную проблему в улье

Я пытаюсь вычислить количество (уникальных) появлений каждого элемента в столбце таблицы Hive относительно других столбцов. Я пробовал этот запрос, но у меня есть это выражение ошибки не в пользовательском ключе GROUP BY ...
вопрос задан: 26 March 2019 13:40
1
ответ

Найдите второе место по зарплате в каждом отделе, используя rank / density_rank в улье

Это были два вопроса, которые мне задавали во время собеседования, но единственное условие - использовать rank / dens_rank. Найдите второе место по зарплате в каждом отделе, используя rank / dens_rank в улье. ...
вопрос задан: 18 March 2019 11:48
1
ответ

Транзакции на уровне строк в улье

Я новичок в HiveQL. Когда я создавал таблицу, я понял, что нам нужно сохранять ИСТИНА в некоторых свойствах транзакций. Затем я рассмотрел, что это такое: hive > set hive.support ....
вопрос задан: 4 March 2019 12:33
1
ответ

Улей: Как взорвать таблицу с колонкой карты

У меня есть такая таблица + ----- + ------------------------------ + | id | mapCol | + ----- + ------------------------------ + | id1 | {key1: val1, key2: val2} | | id2 | {...
вопрос задан: 2 March 2019 16:10
1
ответ

Загрузить данные в массив улья

У меня есть данные в CSV выглядит как Дэвид, "" "SMARTPHONE, 6" "|" "COMPUTER, 3" "|" "LAPTOP, 1" "" Я пытаюсь загрузить это в мою таблицу кустов создать таблицу user_device (имя строки, массив устройств < struct < devicename: ...
вопрос задан: 1 March 2019 19:54
1
ответ

Соединение с одним и тем же столом дважды с разными условиями

У меня есть таблица, которая содержит лето активности пользователей в наборе продуктов на каждый день. Теоретически существует только одна строка для < UserId, Product, Client, Date > кортеж, так как эта таблица ...
вопрос задан: 28 February 2019 22:33
1
ответ

Добавить значения в списки, который является строковым столбцом в кусте

У меня есть набор данных, где столбцы состоят из списков, который имеет строковый тип данных. Column_A | Column_B AAA | 1 23 56 89 74 52 BBB | 63 99 44 2 80 87 58 63 CCC | 96 45 23 84 62 74 Здесь, в ...
вопрос задан: 28 February 2019 13:23
1
ответ

Возникла проблема в запросе куста при генерации пропущенных дат

У меня есть требование, где мне нужно вернуться к предыдущим значениям для столбца до 1000 строк и получить эти 1000 предыдущих дат для моих следующих шагов, но все эти 1000 предыдущих дат отсутствуют для
вопрос задан: 19 January 2019 13:37
1
ответ

Масштабирование значений столбцов от 0 до 1 в улье

У меня есть таблица с именем table1 со следующими столбцами: - ID count1 count2 A 3 5 B 1 7 C 2 9 Мне нужны столбцы - count1 и count2, чтобы иметь значения от 0 до 1. Мне нужно ...
вопрос задан: 18 January 2019 09:11
1
ответ

Конвертировать HiveQL в Spark Scala

Я хочу преобразовать запрос HiveQL с оконной функцией в запрос Scala Spark ... но постоянно получаю одно и то же исключение Контекст проблемы: mytable состоит из полей категории и продукта. Мне нужно ...
вопрос задан: 17 January 2019 19:14
1
ответ

SQL Hive добавить столбец на основе значения столбца

У меня есть запрос, который выглядит как выберите число, класс, unix_timestamp (date1) - unix_timestamp (date2) в качестве time_example, сумма (unix_timestamp (date1) - unix_timestamp (date2)) over (разделить ...
вопрос задан: 16 January 2019 19:13
1
ответ

Заголовочные файлы для каталога данных клея AWS

У меня есть некоторые данные в s3, которые я хочу использовать AWS Glue для сканирования и сохранения в каталоге данных. Проблема у меня заключается в том, что сами данные не имеют строк заголовков. Вместо этого есть отдельный заголовочный файл ("...
вопрос задан: 15 January 2019 16:51
1
ответ

В Hive, как указать разделители с разделителями столбцов для типов данных структуры с помощью пользовательских разделителей serde2

Я пытаюсь создать таблицу, как показано ниже. CREATE TABLE r_test (foo INT, bar STRING, адрес STRUCT & lt; street: STRING, город: STRING, состояние: STRING, zip: INT & gt;) ROW FORMAT SERDE 'org.apache.hadoop.hive ....
вопрос задан: 14 July 2018 00:07
0
ответов

Нужно руководство по переписыванию этого запроса

Текущий сценарий => У нас есть запрос, который мы выполняем на нашем кластере продуктов. этот запрос выбирает только 3 поля из объединения между 1 таблицей и (вложенным способом объединения) другой огромной таблицы, а затем ...
вопрос задан: 1 April 2019 06:09
0
ответов

Как UDFMethodResolver работает в классе Hive UDF?

Я новичок в Улей. Я узнал, что пользовательская функция может быть создана с любой сигнатурой метода методаvalu (). (За исключением типа возврата void). Мне любопытно узнать, как UDFMethodResolver разрешает ...
вопрос задан: 28 March 2019 06:02
0
ответов

специальный символ с заглавной () регистровой функцией в импале

У меня есть требование в моем текущем проекте. у нас есть столбец в файле hdfs "ASCII_FIXED_STR", когда я получаю через Impala с использованием запроса ниже, я не получаю правильный вывод SQL без
вопрос задан: 20 March 2019 14:01
0
ответов

Я хочу напечатать слово в каждой букве и посчитать письмо, сколько раз

sreenath я хочу вывод, как это выбрать * из string_split (разделитель ''); s - 1 r - 1 e - 2 n - 1 t - 1
вопрос задан: 19 January 2019 17:38
0
ответов

Inner Join On (Hive) дает другой результат, чем PySpark Inner Join

Я наблюдал это явление сегодня. Когда я выполняю следующую команду в Hive CLI, я получаю что-то отличное от того, что делает это с pyspark: Hive: Выберите count (отличный t1.fieldX) от ...
вопрос задан: 17 January 2019 15:12
0
ответов

режим защиты от улей

Я создал представление в таблице hive. Фактическая таблица: CREATE TABLE userinfo (строка firstname, строка lastname, строка ssn, строка пароля); Просмотр: CREATE VIEW safer_user_info AS SELECT имя, фамилия ...
вопрос задан: 13 July 2018 09:26
0
ответов

Выражение улья не в группе по ключу

Я создаю таблицу в HIVE. В нем есть следующие столбцы: id bigint, rank bigint, строка даты, которую я хочу получить в среднем (рейтинге) за месяц. Я могу использовать эту команду. Оно работает. выберите a.lens_id, avg (a.rank) из ...
вопрос задан: 11 May 2018 23:28
0
ответов

Объединение двух таблиц в Hive с помощью HiveQL (Hadoop )[дубликат]

Возможный дубликат :SQL-запрос JOIN with Table CREATE EXTERNAL TABLE IF NOT EXISTS TestingTable1 (Это ГЛАВНАЯ таблица, по которой необходимо проводить сравнения) ( ПОКУПАТЕЛЬ _ID БОЛЬШОЙ, ПУНКТ _ID...
вопрос задан: 23 May 2017 12:33