1) Вы можете создать внешнюю таблицу hive
create external table emp(name string,job_title string,department string,salary_per_year int)
row format delimited
fields terminated by ','
location '.. hdfs location of csv file '
2) Еще одна таблица улей, в которой будет храниться файл паркета
create external table emp_par(name string,job_title string,department string,salary_per_year int)
row format delimited
stored as PARQUET
location 'hdfs location were you want the save parquet file'
. Вставьте таблицу в одну таблицу в таблицу :
insert overwrite table emp_par select * from emp