извлечение задержки и момент дня из кадра данных pandas [дубликат]

Здесь он

  SELECT CONVERT (DATETIME, GETDATE (), 105)  

Just Changed VARCHAR to DATETIME

41
задан Andy Hayden 2 March 2014 в 22:00
поделиться

4 ответа

Предполагая, что это столбцы datetime (если они не применяются to_datetime), вы можете просто их вычесть:

df['A'] = pd.to_datetime(df['A'])
df['B'] = pd.to_datetime(df['B'])

In [11]: df.dtypes  # if already datetime64 you don't need to use to_datetime
Out[11]:
A    datetime64[ns]
B    datetime64[ns]
dtype: object

In [12]: df['A'] - df['B']
Out[12]:
one   -58 days
two   -26 days
dtype: timedelta64[ns]

In [13]: df['C'] = df['A'] - df['B']

In [14]: df
Out[14]:
             A          B        C
one 2014-01-01 2014-02-28 -58 days
two 2014-02-03 2014-03-01 -26 days

Примечание: убедитесь, что вы используете новую версию pandas ( например, 0.13.1), это может не работать в более старых версиях.

47
ответ дан Andy Hayden 16 August 2018 в 01:32
поделиться
  • 1
    Можем ли мы избавиться от «дней»? в результате мы просто должны увидеть числовое значение, т. е. -58, -26 в этом случае. – 0nir 22 October 2014 в 18:24
  • 2
    для расширения на @AndyHayden комментарий, который работает, но он должен pd.offsets.Day(1) (с 's'). Я также обычно отрицаю это, поэтому вы получаете (df['A'] - df['B']) / pd.offsets.Day(-1) – dirkjot 14 October 2015 в 18:54
  • 3
    Однако, если вы хотите сделать это на целой серии, вам нужно (df['A'] - df['B']) / np.timedelta64(-1, 'D') по причинам, которые я не совсем понимаю. – dirkjot 14 October 2015 в 19:05
  • 4
    @dirkjot Спасибо, что нашли опечатку! IIRC это было исправлено в последних пандах, вы используете 0.16.2 / 0.17? – Andy Hayden 14 October 2015 в 19:27
  • 5
    Я обнаружил, что это было немного ошибкой, когда отсутствовали данные. Проблемы состоят в том, что 1) недостающие данные не имеют атрибута .isnull() и 2) у него есть атрибут .day, но у не пропущенных данных есть атрибут .days. Поэтому после создания новой переменной я запустил цикл над каждым obs erve, который проверяет: if hasattr(obs,'days') затем назначить obs.days и назначить np.nan. – webelo 26 April 2017 в 21:44

Понимание списка - ваш лучший выбор для самого Pythonic (и самого быстрого) способа сделать это:

[int(i.days) for i in (df.B - df.A)]
  1. i вернет timedelta (например, «-58 дней»)
  2. i.days вернет это значение как длинное целочисленное значение (например, -58L)
  3. int (i.days) даст вам -58, который вы ищете.

Если ваши столбцы не в формате даты и времени. Более короткий синтаксис будет выглядеть следующим образом: df.A = pd.to_datetime(df.A)

8
ответ дан A.Kot 16 August 2018 в 01:32
поделиться

Чтобы удалить текстовый элемент «дней», вы также можете использовать аксессуар dt () для серии: https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series .dt.html

Итак,

df['A'] = pd.to_datetime(df['A'])
df['B'] = pd.to_datetime(df['B'])

df['C'] = (df['B'] - df['A']).dt.days

, который возвращает

             A          B   C
one 2014-01-01 2014-02-03  33
two 2014-02-03 2014-03-01  26
26
ответ дан Ricky McMaster 16 August 2018 в 01:32
поделиться

Как насчет этого:

times['days_since'] = max(list(df.index.values))  
times['days_since'] = times['days_since'] - times['months']  
times
1
ответ дан tharindu_DG 16 August 2018 в 01:32
поделиться
Другие вопросы по тегам:

Похожие вопросы: