1
ответ

Как удалить дубликаты из строки, содержащей значения, разделенные запятыми?

Я конвертировал некоторый код R в HQL (Hive). Я застрял в чем-то. У меня есть col "значения", и это в основном объединение некоторых других столбцов, разделенных запятой например, значения a, b, c, a, a ...
вопрос задан: 20 March 2019 04:48
1
ответ

Удаляемая таблица Hive не удаляет файлы в HDFS. Любые решения?

При удалении управляемых таблиц из куста связанные с ним файлы из hdf не удаляются (в лазурных блоках данных). Я получаю следующую ошибку: [Simba] SparkJDBCDriver ОШИБКА обрабатывается ...
вопрос задан: 18 March 2019 21:43
1
ответ

Фильтрация набора данных улья на основе списка Python

Я довольно новичок в улье и искре, но то, что я хочу сделать, кажется, что это должно быть просто. По сути, я хочу взять список из Python, а затем только извлекать записи из улья, в которых есть ключ к этому ...
вопрос задан: 18 March 2019 18:50
1
ответ

как работает hive без файла hive-site.xml?

Я пытаюсь настроить улей на моем местном. Я запустил все процессы Hadoop и настроил путь {hive} / bin. В командной строке я могу запускать команды улья, создавать и читать таблицы. Мои вопросы - 1) это ...
вопрос задан: 18 March 2019 18:37
1
ответ

Найдите второе место по зарплате в каждом отделе, используя rank / density_rank в улье

Это были два вопроса, которые мне задавали во время собеседования, но единственное условие - использовать rank / dens_rank. Найдите второе место по зарплате в каждом отделе, используя rank / dens_rank в улье. ...
вопрос задан: 18 March 2019 11:48
1
ответ

Конфигурация разделителя линий Hive CSV

При создании внешней таблицы в файле CSV с помощью Hive вы можете использовать внутренний CSV-файл Hive: ... ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE LOCATION '...' ...
вопрос задан: 14 March 2019 15:28
1
ответ

Изменить только один столбец-разделитель PYTHON

a = ['0, Италия, "Ароматы включают в себя тропические фрукты, метлу, серу и сушеную траву. Вкус не слишком выразительный, предлагая незрелое яблоко, цитрусовые и сушеный шалфей наряду с оживленной кислотностью.", Vulkà Bianco, ...
вопрос задан: 6 March 2019 13:36
1
ответ

Транзакции на уровне строк в улье

Я новичок в HiveQL. Когда я создавал таблицу, я понял, что нам нужно сохранять ИСТИНА в некоторых свойствах транзакций. Затем я рассмотрел, что это такое: hive > set hive.support ....
вопрос задан: 4 March 2019 12:33
1
ответ

импортировать данные из aws s3 в mysql или любую другую базу данных не aws

Я новичок в AWS. У меня есть данные в моем S3 Bucket в формате CSV. Как я могу загрузить эти данные в MySQL или куст. Если нет, то вы можете показать мне способ импортировать данные из s3 в любую другую базу данных non-aws. Спасибо в ...
вопрос задан: 4 March 2019 06:41
1
ответ

Как загрузить несколько файлов Json (которые могут иметь разные поля) в одну таблицу кустов

У меня есть два файла JSON, которые создаются в два разных дня. Оба они подпадают под одну и ту же спецификацию бизнеса. Поэтому я хочу вставить в одну таблицу улья. Как это можно сделать? Сценарий: ...
вопрос задан: 3 March 2019 10:28
1
ответ

Улей: Как взорвать таблицу с колонкой карты

У меня есть такая таблица + ----- + ------------------------------ + | id | mapCol | + ----- + ------------------------------ + | id1 | {key1: val1, key2: val2} | | id2 | {...
вопрос задан: 2 March 2019 16:10
1
ответ

Загрузить данные в массив улья

У меня есть данные в CSV выглядит как Дэвид, "" "SMARTPHONE, 6" "|" "COMPUTER, 3" "|" "LAPTOP, 1" "" Я пытаюсь загрузить это в мою таблицу кустов создать таблицу user_device (имя строки, массив устройств < struct < devicename: ...
вопрос задан: 1 March 2019 19:54
1
ответ

Добавить значения в списки, который является строковым столбцом в кусте

У меня есть набор данных, где столбцы состоят из списков, который имеет строковый тип данных. Column_A | Column_B AAA | 1 23 56 89 74 52 BBB | 63 99 44 2 80 87 58 63 CCC | 96 45 23 84 62 74 Здесь, в ...
вопрос задан: 28 February 2019 13:23
1
ответ

Проблема вставки данных в таблицу кустов с использованием искры

В настоящее время я работаю над Spark версии 2.1.0, и в рамках моей работы по сбору данных я должен использовать метод insertinto для загрузки данных в таблицы кустов. Но есть ошибка с версией Spark 2.1, вставьте в ...
вопрос задан: 26 February 2019 16:41
1
ответ

Невозможно выполнить любой запрос к таблице

Пока я выполняю следующий запрос SELECT * FROM table_unfilter WHERE date = '2010-08-01'; Я получаю Сбой: ошибка в получении блокировок: Ошибка связи с метастазами Когда я установил ...
вопрос задан: 26 February 2019 12:44
1
ответ

Найти сгруппированные записи в одной таблице, которые сопоставляются в другой таблице

У меня есть две таблицы, как показано ниже в таблице Hive: + | id | предмет | дата | количество | + ---- + ---------- + ---------- + ----------- + | 1 | Сделать это | 10-10-13 | ...
вопрос задан: 23 February 2019 23:19
1
ответ

Spark SQL - сравнение данных

Как лучше всего сравнить два файла CSV (миллионы строк) с одной и той же схемой со столбцом первичного ключа и распечатать различия. Например, CSV1 Id name zip 1 name1 ...
вопрос задан: 23 February 2019 18:32
1
ответ

jive драйвер hive: javax.xml.stream.XMLStreamException: при попытке вывести второй корень < r >

Я использую драйвер Hive JDBC 3.1 (от Hortontworks или официального, у меня такие же проблемы) в приложении c # (Dundas), и я получаю сообщение об ошибке: драйвер jive hive: javax.xml.stream.XMLStreamException: ...
вопрос задан: 19 February 2019 07:04
1
ответ

Драйвер ODBC для кустов не распознает unix_timestamp

Краткая версия: Как я могу получить разницу в секундах между двумя временными метками через драйвер ODBC? Длинная версия: Использование ODBC для простого запроса (не то, чтобы я использовал приведение (... как метку времени), чтобы ...
вопрос задан: 18 February 2019 15:06
1
ответ

Невозможно создать hiveserver2. Ошибка при настройке авторизации

Я пытаюсь запустить hiveserver2 в моем локальном экземпляре hadoop. Я настроил куст, и необходимые службы hadoop также запущены. Но когда я пытаюсь запустить hiveserver2, происходит сбой с приведенным ниже ...
вопрос задан: 19 January 2019 15:26
1
ответ

Как обращаться со встроенными запятыми в улье?

Например, если у меня есть CSV-файл с тремя столбцами, sno, name, salary 1, latha, 2000 2, Bhavish, Chaturvedi, 3000 Как загрузить этот тип файла в куст. Я попробовал несколько постов из stackoverflow, но ...
вопрос задан: 19 January 2019 13:59
1
ответ

Возникла проблема в запросе куста при генерации пропущенных дат

У меня есть требование, где мне нужно вернуться к предыдущим значениям для столбца до 1000 строк и получить эти 1000 предыдущих дат для моих следующих шагов, но все эти 1000 предыдущих дат отсутствуют для
вопрос задан: 19 January 2019 13:37
1
ответ

Масштабирование значений столбцов от 0 до 1 в улье

У меня есть таблица с именем table1 со следующими столбцами: - ID count1 count2 A 3 5 B 1 7 C 2 9 Мне нужны столбцы - count1 и count2, чтобы иметь значения от 0 до 1. Мне нужно ...
вопрос задан: 18 January 2019 09:11
1
ответ

Путаница с внешними столами в улье

Я создал внешнюю таблицу улья, используя следующую команду: use hive2; создать внешнюю таблицу depTable (depId int comment 'Это уникальный идентификатор для каждого dep', строка depName, строка местоположения) ...
вопрос задан: 18 January 2019 05:11
1
ответ

Не могу изменить тип столбца в Hive

Я хочу изменить тип столбца в таблице Hive. Во-первых, это описание моей таблицы улья: hive (Indicurs) > описать adataindicateursf; ОК, строка имен ...
вопрос задан: 17 January 2019 10:16
1
ответ

Несколько картографов записывают вывод в один файл

я новичок в hadoop, и меня поразила проблема. У меня есть случай использования, когда я хочу запустить задание только на карте для файла размером около 2 ГБ. Я создал 4 разделения размером 512 МБ, используя CombineHiveInputFormat и ...
вопрос задан: 17 January 2019 04:18
1
ответ

Путь хранилища кустов Apache по умолчанию в HDFS

Я впервые установил HIVE на 3-узловом кластере CentOS 7 для целей POC. HIVE устанавливается внутри корневой папки пользователя (hduser1) и указывается в файле .bashrc. export HIVE_HOME = / home / hduser1 / ...
вопрос задан: 16 January 2019 22:48
1
ответ

SQL Hive добавить столбец на основе значения столбца

У меня есть запрос, который выглядит как выберите число, класс, unix_timestamp (date1) - unix_timestamp (date2) в качестве time_example, сумма (unix_timestamp (date1) - unix_timestamp (date2)) over (разделить ...
вопрос задан: 16 January 2019 19:13
1
ответ

функция окна улья - изменение строки в значении

У меня есть данные, в которых есть поля id / flag и date. Мне нужно заполнить поле flag_date, как указано ниже.
вопрос задан: 16 January 2019 00:41
1
ответ

Не могу получить все данные, которые я хочу, из объединения

У меня есть таблица улья, в которой есть несколько http-сессий, которые мне нужно проанализировать. Один столбец имеет идентификатор сеанса http, который согласован на протяжении всего сеанса. Я пытаюсь найти все строки, которые являются частью ...
вопрос задан: 16 January 2019 00:34