0
ответов

Конвертировать строку pyspark в формат даты

У меня есть дата-фрейм pyspark со строковым столбцом в формате MM-dd-yyyy, и я пытаюсь преобразовать его в столбец даты. Я пытался: df.select (to_date (df.STRING_COLUMN) .alias ('...
вопрос задан: 28 June 2016 15:45
0
ответов

Как установить количество разделов / узлов при импорте данных в Spark

Проблема: я хочу импортировать данные в Spark EMR из S3, используя: data = sqlContext.read.json ("s3n: // ....."). Есть ли способ указать количество узлов, которые Spark использует для загрузки и обрабатывать данные? ...
вопрос задан: 4 January 2016 19:50