Удалять пробелы из строк при разделении на & ldquo;, & rdquo;

Question

Удалять пробелы из строк при разделении на & ldquo;, & rdquo;

Ошибка, которую вы видите, должна быть почти понятной. Существует строгое сопоставление типов Catalyst / SQL и типов Scala, которые можно найти в в соответствующем разделе из справочника Spark SQL, DataFrames и Datasets Guide .

В частности, типы struct преобразуются в o.a.s.sql.Row (в вашем конкретном случае данные будут отображаться как Seq[Row]).

Существуют разные методы, которые могут использоваться для отображения данных как конкретных типов :

Определение UDT (пользовательский тип), который был удален в 2.0.0 и теперь не имеет замены /g4].
Преобразование DataFrame в Dataset[T], где T является искомым локальным типом.

с использованием только прежнего подхода может быть применимым в этом конкретный сценарий.

Если вы хотите получить доступ к investments.funding_round.raised_amount с помощью UDF, вам понадобится что-то вроде этого:

val getRaisedAmount = udf((investments: Seq[Row]) => scala.util.Try(
  investments.map(_.getAs[Row]("funding_round").getAs[Long]("raised_amount"))
).toOption)

, но простой select должен быть намного безопаснее и чище:

df.select($"investments.funding_round.raised_amount")

1

java regex

задан Saneth Chandrasekara 30 March 2019 в 22:49

1 ответ

Другие вопросы по тегам:

java regex

Удалять пробелы из строк при разделении на & ldquo;, & rdquo;

1 ответ

Похожие вопросы: