Итак, как вы заметили, вы не можете выполнить transformation
внутри другого transformation
(обратите внимание, что flatMap
& amp; map
являются transformations
, а не actions
, поскольку они возвращают RDD). К счастью, то, что вы пытаетесь выполнить, напрямую поддерживается другой трансформацией в Spark API, а именно cartesian
(см. http://spark.apache.org/docs/latest/api/python/pyspark.html#pyspark .RDD ).
Итак, вы хотели бы сделать rdd1.cartesian(rdd2)
.