Python-аналог PHP-функции natsort (сортировка списка с использованием алгоритма «естественного порядка») [duplicate]

На этот вопрос уже есть ответ здесь:

Я хотел бы знать, есть ли что-то похожее на функцию PHP natsort в Python?

l = ['image1.jpg', 'image15.jpg', 'image12.jpg', 'image3.jpg']
l.sort()

дает:

['image1.jpg', 'image12.jpg', 'image15.jpg', 'image3.jpg']

, но я хотел бы получить:

['image1.jpg', 'image3.jpg', 'image12.jpg', 'image15.jpg']

UPDATE

Решение основано на этой ссылке

def try_int(s):
    "Convert to integer if possible."
    try: return int(s)
    except: return s

def natsort_key(s):
    "Used internally to get a tuple by which s is sorted."
    import re
    return map(try_int, re.findall(r'(\d+|\D+)', s))

def natcmp(a, b):
    "Natural string comparison, case sensitive."
    return cmp(natsort_key(a), natsort_key(b))

def natcasecmp(a, b):
    "Natural string comparison, ignores case."
    return natcmp(a.lower(), b.lower())

l.sort(natcasecmp);
22
задан smci 29 November 2018 в 05:27
поделиться

1 ответ

Из моего ответа на Алгоритм естественной сортировки:

import re
def natural_key(string_):
    """See http://www.codinghorror.com/blog/archives/001018.html"""
    return [int(s) if s.isdigit() else s for s in re.split(r'(\d+)', string_)]

Пример:

>>> L = ['image1.jpg', 'image15.jpg', 'image12.jpg', 'image3.jpg']
>>> sorted(L)
['image1.jpg', 'image12.jpg', 'image15.jpg', 'image3.jpg']
>>> sorted(L, key=natural_key)
['image1.jpg', 'image3.jpg', 'image12.jpg', 'image15.jpg']

Для поддержки строк Unicode следует использовать .isdecimal() вместо .isdigit(). Смотрите пример в комментарии @phihag's. Похожие: Как раскрыть свойство числового значения Unicodes.

.isdigit() может также потерпеть неудачу (возвращаемое значение не принимается int()) для байтовой строки на Python 2 в некоторых локалях, например, '\xb2' ('²') в локали cp1252 на Windows.

45
ответ дан 29 November 2019 в 03:47
поделиться
Другие вопросы по тегам:

Похожие вопросы: