Chrome: веб-сайт использует HSTS. Сетевые ошибки ... эта страница, вероятно, будет работать позже

В последнем документе вы можете использовать rdd.collect (). foreach (println) в драйвере для отображения всех, но это может вызвать проблемы с памятью в драйвере, лучше всего использовать rdd.take (wish_number)

https://spark.apache.org/docs/2.2.0/rdd-programming-guide.html

Чтобы распечатать все элементы в драйвере, один может использовать метод collect (), чтобы сначала привести RDD к узлу драйвера таким образом: rdd.collect (). foreach (println). Это может привести к тому, что драйвер исчерпает память, потому что collect () извлекает весь RDD на одну машину; если вам нужно всего лишь напечатать несколько элементов RDD, более безопасный подход - использовать take (): rdd.take (100) .foreach (println).

141
задан Noctis 29 March 2017 в 06:03
поделиться