PySpark: groupBy два столбца с категориальными переменными и сортировать по возрастанию

Короткий ответ заключается в том, что вы не можете открыть browserAction программно. Но вы можете создать dialog с вашим сценарием контента, который эмулирует ваш browserAction и отображает, что isntead (программно). Однако вы не сможете получить доступ к своему background page вашего расширения из этого всплывающего окна, как вы можете, из своего popup.html. Вы должны будете pass message вместо вашего расширения.

1
задан Rodrigo López 19 March 2019 в 23:56
поделиться

1 ответ

Вы считаете правильно. Вам просто нужно использовать окно row_number, чтобы выбрать 3 верхних и правильно упорядочить результаты. Посмотрите на код ниже.

df.groupBy("estado","producto").count()
  .withColumn("row_num",row_number().over(Window.partitionBy("estado","producto").orderBy(col("count").desc)))
  .filter(col("row_num") <= 3)
  .drop("row_num")
  .orderBy(col("estado"), col("producto"), col("count").desc)

Проверьте эту ссылку для правильного использования row_number в Pyspark. Spark SQL Row_number () PartitionBy Sort Desc

0
ответ дан Apurba Pandey 19 March 2019 в 23:56
поделиться
Другие вопросы по тегам:

Похожие вопросы: