Вычислить возраст из pandas csv с точки зрения лет [дубликат]

Question

Вычислить возраст из pandas csv с точки зрения лет [дубликат]

Феликс уже дал отличный ответ, но я думал, что сделаю сравнение скорости различных методов:

10,59 сек (105,9us / itn) - copy.deepcopy(old_list)
10.16 сек (101.6us / itn) - метод чистого питона Copy(), копирующий классы с глубокой копией
1.488 сек (14.88us / itn) - чистый питон Copy() метод не копирует классы (только dicts / lists / tuples)
0,325 с (3,25us / itn) - for item in old_list: new_list.append(item)
0.217 sec (2.17us / itn) - [i for i in old_list] (понимание списка )
0,186 с (1,86us / itn) - copy.copy(old_list)
0,075 сек (0,75 us / itn) - list(old_list)
0,053 сек (0,53us / itn) - new_list = []; new_list.extend(old_list)
0,039 сек (0,39us / itn) - old_list[:] ( list slicing )

Таким образом, самая быстрая сортировка списка. Но имейте в виду, что copy.copy(), list[:] и list(list), в отличие от copy.deepcopy() и версии python, не копируют списки, словари и экземпляры класса в списке, поэтому, если оригиналы меняются, они будут меняться в скопированный список тоже и наоборот.

(Вот скрипт, если кто-то заинтересован или хочет поднять какие-либо проблемы:)

from copy import deepcopy

class old_class:
    def __init__(self):
        self.blah = 'blah'

class new_class(object):
    def __init__(self):
        self.blah = 'blah'

dignore = {str: None, unicode: None, int: None, type(None): None}

def Copy(obj, use_deepcopy=True):
    t = type(obj)

    if t in (list, tuple):
        if t == tuple:
            # Convert to a list if a tuple to 
            # allow assigning to when copying
            is_tuple = True
            obj = list(obj)
        else: 
            # Otherwise just do a quick slice copy
            obj = obj[:]
            is_tuple = False

        # Copy each item recursively
        for x in xrange(len(obj)):
            if type(obj[x]) in dignore:
                continue
            obj[x] = Copy(obj[x], use_deepcopy)

        if is_tuple: 
            # Convert back into a tuple again
            obj = tuple(obj)

    elif t == dict: 
        # Use the fast shallow dict copy() method and copy any 
        # values which aren't immutable (like lists, dicts etc)
        obj = obj.copy()
        for k in obj:
            if type(obj[k]) in dignore:
                continue
            obj[k] = Copy(obj[k], use_deepcopy)

    elif t in dignore: 
        # Numeric or string/unicode? 
        # It's immutable, so ignore it!
        pass 

    elif use_deepcopy: 
        obj = deepcopy(obj)
    return obj

if __name__ == '__main__':
    import copy
    from time import time

    num_times = 100000
    L = [None, 'blah', 1, 543.4532, 
         ['foo'], ('bar',), {'blah': 'blah'},
         old_class(), new_class()]

    t = time()
    for i in xrange(num_times):
        Copy(L)
    print 'Custom Copy:', time()-t

    t = time()
    for i in xrange(num_times):
        Copy(L, use_deepcopy=False)
    print 'Custom Copy Only Copying Lists/Tuples/Dicts (no classes):', time()-t

    t = time()
    for i in xrange(num_times):
        copy.copy(L)
    print 'copy.copy:', time()-t

    t = time()
    for i in xrange(num_times):
        copy.deepcopy(L)
    print 'copy.deepcopy:', time()-t

    t = time()
    for i in xrange(num_times):
        L[:]
    print 'list slicing [:]:', time()-t

    t = time()
    for i in xrange(num_times):
        list(L)
    print 'list(L):', time()-t

    t = time()
    for i in xrange(num_times):
        [i for i in L]
    print 'list expression(L):', time()-t

    t = time()
    for i in xrange(num_times):
        a = []
        a.extend(L)
    print 'list extend:', time()-t

    t = time()
    for i in xrange(num_times):
        a = []
        for y in L:
            a.append(y)
    print 'list append:', time()-t

    t = time()
    for i in xrange(num_times):
        a = []
        a.extend(i for i in L)
    print 'generator expression extend:', time()-t

EDIT: добавлены классы старого стиля и задает тесты, и сделал версию python намного быстрее и добавил еще несколько методов, включая выражения списков и extend().

47

python pandas

задан Asaf Hanish 3 September 2014 в 14:53

4 ответа

Другие вопросы по тегам:

python pandas

Похожие вопросы:

score 55 · Answer 1

Используйте атрибут dt.days . Предположим, что td - это имя вашей серии timedelta, доступ к этому атрибуту через:

td.dt.days

Вы также можете получить атрибуты seconds и microseconds таким же образом.

55

ответ дан abeboparebop 21 August 2018 в 22:41

1

Мне нравится этот комментарий для простоты и не требует импорта другой библиотеки. – NickBraunagel 17 July 2017 в 20:54

score 52 · Answer 2

Вы можете сделать это, где td - ваша серия timedeltas. Деление преобразует наносекундные дельта в дельта дней, а конверсия в int падает до целых дней.

import numpy as np

(td / np.timedelta64(1, 'D')).astype(int)

52

ответ дан chrisb 21 August 2018 в 22:41

1

Благодаря! Также спустя 15 минут поиска я нашел это. [Д0] stackoverflow.com/questions/18215317/… – Asaf Hanish 3 September 2014 в 15:13

score 0 · Answer 3

Вы можете использовать функцию pd.to_timedelta (см. https://pandas.pydata.org/pandas-docs/stable/generated/pandas.to_timedelta.html )

Из документации:

pd.to_timedelta('1 days 06:05:01.00003')

Timedelta('1 days 06:05:01.000030')

И он также работает с столбцами данных.

score 6 · Answer 4

Объекты Timedelta имеют атрибуты экземпляра только для чтения .days, .seconds и .microseconds.

6

ответ дан Qiao Zhang 21 August 2018 в 22:41