На этот вопрос уже есть ответ здесь:
Я хотел бы знать, есть ли что-то похожее на функцию PHP natsort в Python?
l = ['image1.jpg', 'image15.jpg', 'image12.jpg', 'image3.jpg']
l.sort()
дает:
['image1.jpg', 'image12.jpg', 'image15.jpg', 'image3.jpg']
, но я хотел бы получить:
['image1.jpg', 'image3.jpg', 'image12.jpg', 'image15.jpg']
UPDATE
Решение основано на этой ссылке
def try_int(s):
"Convert to integer if possible."
try: return int(s)
except: return s
def natsort_key(s):
"Used internally to get a tuple by which s is sorted."
import re
return map(try_int, re.findall(r'(\d+|\D+)', s))
def natcmp(a, b):
"Natural string comparison, case sensitive."
return cmp(natsort_key(a), natsort_key(b))
def natcasecmp(a, b):
"Natural string comparison, ignores case."
return natcmp(a.lower(), b.lower())
l.sort(natcasecmp);
Из моего ответа на Алгоритм естественной сортировки:
import re
def natural_key(string_):
"""See http://www.codinghorror.com/blog/archives/001018.html"""
return [int(s) if s.isdigit() else s for s in re.split(r'(\d+)', string_)]
Пример:
>>> L = ['image1.jpg', 'image15.jpg', 'image12.jpg', 'image3.jpg']
>>> sorted(L)
['image1.jpg', 'image12.jpg', 'image15.jpg', 'image3.jpg']
>>> sorted(L, key=natural_key)
['image1.jpg', 'image3.jpg', 'image12.jpg', 'image15.jpg']
Для поддержки строк Unicode следует использовать .isdecimal()
вместо .isdigit()
. Смотрите пример в комментарии @phihag's. Похожие: Как раскрыть свойство числового значения Unicodes.
.isdigit()
может также потерпеть неудачу (возвращаемое значение не принимается int()
) для байтовой строки на Python 2 в некоторых локалях, например, '\xb2' ('²') в локали cp1252 на Windows.