pyspark-sql - список вопросов по программированию pyspark-sql

ответов

Конвертировать строку pyspark в формат даты

У меня есть дата-фрейм pyspark со строковым столбцом в формате MM-dd-yyyy, и я пытаюсь преобразовать его в столбец даты. Я пытался: df.select (to_date (df.STRING_COLUMN) .alias ('...

вопрос задан: 28 June 2016 15:45

ответов

Как установить количество разделов / узлов при импорте данных в Spark

Проблема: я хочу импортировать данные в Spark EMR из S3, используя: data = sqlContext.read.json ("s3n: // ....."). Есть ли способ указать количество узлов, которые Spark использует для загрузки и обрабатывать данные? ...

pyspark-sql database-partitioning apache-spark sql

вопрос задан: 4 January 2016 19:50