Я конвертировал некоторый код R в HQL (Hive). Я застрял в чем-то. У меня есть col "значения", и это в основном объединение некоторых других столбцов, разделенных запятой например, значения a, b, c, a, a ...
При удалении управляемых таблиц из куста связанные с ним файлы из hdf не удаляются (в лазурных блоках данных). Я получаю следующую ошибку: [Simba] SparkJDBCDriver ОШИБКА обрабатывается ...
Я довольно новичок в улье и искре, но то, что я хочу сделать, кажется, что это должно быть просто. По сути, я хочу взять список из Python, а затем только извлекать записи из улья, в которых есть ключ к этому ...
Я пытаюсь настроить улей на моем местном. Я запустил все процессы Hadoop и настроил путь {hive} / bin. В командной строке я могу запускать команды улья, создавать и читать таблицы. Мои вопросы - 1) это ...
Это были два вопроса, которые мне задавали во время собеседования, но единственное условие - использовать rank / dens_rank. Найдите второе место по зарплате в каждом отделе, используя rank / dens_rank в улье. ...
При создании внешней таблицы в файле CSV с помощью Hive вы можете использовать внутренний CSV-файл Hive: ... ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE LOCATION '...' ...
a = ['0, Италия, "Ароматы включают в себя тропические фрукты, метлу, серу и сушеную траву. Вкус не слишком выразительный, предлагая незрелое яблоко, цитрусовые и сушеный шалфей наряду с оживленной кислотностью.", Vulkà Bianco, ...
Я новичок в HiveQL. Когда я создавал таблицу, я понял, что нам нужно сохранять ИСТИНА в некоторых свойствах транзакций. Затем я рассмотрел, что это такое: hive > set hive.support ....
Я новичок в AWS. У меня есть данные в моем S3 Bucket в формате CSV. Как я могу загрузить эти данные в MySQL или куст. Если нет, то вы можете показать мне способ импортировать данные из s3 в любую другую базу данных non-aws. Спасибо в ...
У меня есть два файла JSON, которые создаются в два разных дня. Оба они подпадают под одну и ту же спецификацию бизнеса. Поэтому я хочу вставить в одну таблицу улья. Как это можно сделать? Сценарий: ...
У меня есть данные в CSV выглядит как Дэвид, "" "SMARTPHONE, 6" "|" "COMPUTER, 3" "|" "LAPTOP, 1" "" Я пытаюсь загрузить это в мою таблицу кустов создать таблицу user_device (имя строки, массив устройств < struct < devicename: ...
У меня есть набор данных, где столбцы состоят из списков, который имеет строковый тип данных. Column_A | Column_B AAA | 1 23 56 89 74 52 BBB | 63 99 44 2 80 87 58 63 CCC | 96 45 23 84 62 74 Здесь, в ...
В настоящее время я работаю над Spark версии 2.1.0, и в рамках моей работы по сбору данных я должен использовать метод insertinto для загрузки данных в таблицы кустов. Но есть ошибка с версией Spark 2.1, вставьте в ...
Пока я выполняю следующий запрос SELECT * FROM table_unfilter WHERE date = '2010-08-01'; Я получаю Сбой: ошибка в получении блокировок: Ошибка связи с метастазами Когда я установил ...
У меня есть две таблицы, как показано ниже в таблице Hive: + | id | предмет | дата | количество | + ---- + ---------- + ---------- + ----------- + | 1 | Сделать это | 10-10-13 | ...
Как лучше всего сравнить два файла CSV (миллионы строк) с одной и той же схемой со столбцом первичного ключа и распечатать различия. Например, CSV1 Id name zip 1 name1 ...
Я использую драйвер Hive JDBC 3.1 (от Hortontworks или официального, у меня такие же проблемы) в приложении c # (Dundas), и я получаю сообщение об ошибке: драйвер jive hive: javax.xml.stream.XMLStreamException: ...
Краткая версия: Как я могу получить разницу в секундах между двумя временными метками через драйвер ODBC? Длинная версия: Использование ODBC для простого запроса (не то, чтобы я использовал приведение (... как метку времени), чтобы ...
Я пытаюсь запустить hiveserver2 в моем локальном экземпляре hadoop. Я настроил куст, и необходимые службы hadoop также запущены. Но когда я пытаюсь запустить hiveserver2, происходит сбой с приведенным ниже ...
Например, если у меня есть CSV-файл с тремя столбцами, sno, name, salary 1, latha, 2000 2, Bhavish, Chaturvedi, 3000 Как загрузить этот тип файла в куст. Я попробовал несколько постов из stackoverflow, но ...
У меня есть требование, где мне нужно вернуться к предыдущим значениям для столбца до 1000 строк и получить эти 1000 предыдущих дат для моих следующих шагов, но все эти 1000 предыдущих дат отсутствуют для
У меня есть таблица с именем table1 со следующими столбцами: - ID count1 count2 A 3 5 B 1 7 C 2 9 Мне нужны столбцы - count1 и count2, чтобы иметь значения от 0 до 1. Мне нужно ...
Я создал внешнюю таблицу улья, используя следующую команду: use hive2; создать внешнюю таблицу depTable (depId int comment 'Это уникальный идентификатор для каждого dep', строка depName, строка местоположения) ...
Я хочу изменить тип столбца в таблице Hive. Во-первых, это описание моей таблицы улья: hive (Indicurs) > описать adataindicateursf; ОК, строка имен ...
я новичок в hadoop, и меня поразила проблема. У меня есть случай использования, когда я хочу запустить задание только на карте для файла размером около 2 ГБ. Я создал 4 разделения размером 512 МБ, используя CombineHiveInputFormat и ...
Я впервые установил HIVE на 3-узловом кластере CentOS 7 для целей POC. HIVE устанавливается внутри корневой папки пользователя (hduser1) и указывается в файле .bashrc. export HIVE_HOME = / home / hduser1 / ...
У меня есть запрос, который выглядит как выберите число, класс, unix_timestamp (date1) - unix_timestamp (date2) в качестве time_example, сумма (unix_timestamp (date1) - unix_timestamp (date2)) over (разделить ...
У меня есть таблица улья, в которой есть несколько http-сессий, которые мне нужно проанализировать. Один столбец имеет идентификатор сеанса http, который согласован на протяжении всего сеанса. Я пытаюсь найти все строки, которые являются частью ...