Как сгруппировать строки по дате во фрейме данных?

Как уже отмечалось многими, HTML не является обычным языком, который может затруднить его синтаксический анализ. Мое решение состоит в том, чтобы превратить его в обычный язык, используя аккуратную программу, а затем использовать синтаксический анализатор XML для использования результатов. Для этого есть много хороших вариантов. Моя программа написана с использованием Java с библиотекой jtidy , чтобы превратить HTML в XML, а затем Jaxen в xpath в результат.

0
задан ThePassenger 17 January 2019 в 15:48
поделиться

1 ответ

# get date out of the index to column    
df = df.reset_index()
# optional
df['date'] = pd.to_datetime(df['date'])
# groupby and output group rows as list
df = df.groupby('date')['name'].apply(list)

РЕДАКТИРОВАТЬ:

вам нужно установить формат strptime на любой формат введенной даты.

df['date'] = df['date'].apply(lambda x: dt.datetime.strptime(x, "%d/%m/%Y %H%M%S").strftime('%d/%m/%Y'))
0
ответ дан naivepredictor 17 January 2019 в 15:48
поделиться
Другие вопросы по тегам:

Похожие вопросы: