rdd.flatMap(identity)
преобразует RDD[List[(String, String)]]
в RDD[(String, String)]
.
scala> val rdd = sc.parallelize(List(List(("a","b"),("b","c")), List(("d","e"))))
...
rdd: org.apache.spark.rdd.RDD[List[(String, String)]] = ParallelCollectionRDD[2] at parallelize at <console>:13
scala> rdd.flatMap(identity)
res2: org.apache.spark.rdd.RDD[(String, String)] = MapPartitionsRDD[3] at flatMap at <console>:14
scala> res2.collect()
...
res3: Array[(String, String)] = Array((a,b), (b,c), (d,e))
Это будет работать так же для любого RDD[List[T]]
, независимо от формы T
. Может помочь больше, если вы поделитесь немного большей информацией о том, что вы пытаетесь сделать.
I use this one personally: gdb's cheat sheet or that link is not broken yet .. . I 've printed it at work.
Вот очень простая шпаргалка по кроссплатформенной отладке, которую я использую (и создал). http://mohit.io/blog/cross-platform-debugging-cheat-sheet/ Надеюсь, вы найдете необходимые команды windbg -> gdb.