Я бы рекомендовал проверить пакет sqldf Gabor Grothendieck , который позволяет вам выражать эти операции в SQL.
library(sqldf)
## inner join
df3 <- sqldf("SELECT CustomerId, Product, State
FROM df1
JOIN df2 USING(CustomerID)")
## left join (substitute 'right' for right join)
df4 <- sqldf("SELECT CustomerId, Product, State
FROM df1
LEFT JOIN df2 USING(CustomerID)")
Я нахожу синтаксис SQL более простым и более естественным, чем его эквивалент R (но это может просто отражать смещение RDBMS).
Для получения дополнительной информации о объединениях см. Gabor's sqldf GitHub .
Решил, передав имена столбцов в качестве параметра заголовка для pandas.to_excel (), а не включив его в кадр данных в качестве имен столбцов. Все еще не уверен, как преодолеть эту проблему в корне и заставить ее рассматривать «рендер» как правильный заголовок столбца.
df2 = pd.DataFrame(X.toarray())
df2.to_excel("temp2.xlsx", headers = word_list)