Pyspark: невозможно импортировать CSV-файл в экземпляр Zeppilin

Это из-за этой строки:

printf ("Hi %s,</br />", $name);

Вы не должны печатать / эхо ничего, прежде чем отправлять заголовки.

0
задан Naseer 21 February 2019 в 03:35
поделиться

1 ответ

Похоже, что у вас не работает metastore. Вы можете попробовать запустить службу.

hive --service metastore  

. Вы можете использовать следующий код, чтобы прочитать csv, который не использует SQLContext

from pyspark.sql import SparkSession
spark = SparkSession \
    .builder \
    .appName("Reading CSV") \
    .getOrCreate()

df_t = spark.read.csv('s3a://Bucket_name/Train - Copy.csv',header=True, inferSchema=True)
df_t.show()
.
0
ответ дан Ranga Vure 21 February 2019 в 03:35
поделиться
Другие вопросы по тегам:

Похожие вопросы: