Как обновить столбец панд, если они имеют одинаковое значение столбцов?

Question

С Spark 2.0+ это стало немного проще:

df.write.csv("path", compression="gzip")

Вам больше не нужен внешний CSV-пакет Databricks.

Автор csv() поддерживает несколько удобных опций. Например:

В дополнение к gzip также можно использовать еще несколько кодеков сжатия:

Полные документы Spark для csv() здесь: Python / Scala

3

python pandas dataframe

задан Frank AK 28 March 2019 в 08:27

1 ответ

Другие вопросы по тегам:

score 0 · Answer 1

Другим возможным решением может быть использование comb_first ()

df2.set_index(['ID']).combine_first(df1.set_index(['ID', 'something'])).reset_index()

А также с помощью isin ()

df1.loc[df1.ID.isin(df2.ID), ['Price']] = df2[['Price']].values