Какой самый питонический способ идентифицировать последовательные дубликаты в списке?

У меня есть список целых чисел, и я хочу иметь возможность идентифицировать смежные блоки дубликатов: то есть я хочу для создания списка дубликатов с сохранением порядка, где каждый дубликат содержит (int_in_question, количество вхождений).

Например, если у меня есть список вроде:

[0, 0, 0, 3, 3, 2, 5, 2, 6, 6]

Я хочу, чтобы результат был:

[(0, 3), (3, 2), (2, 1), (5, 1), (2, 1), (6, 2)]

У меня есть довольно простой способ сделать это с помощью цикла for, временного значения и счетчика:

result_list = []
current = source_list[0]
count = 0
for value in source_list:
    if value == current:
        count += 1
    else:
        result_list.append((current, count))
        current = value
        count = 1
result_list.append((current, count))

Но мне очень нравятся идиомы функционального программирования в Python, и я хотел бы иметь возможность делать это с помощью простое выражение генератора. Однако мне сложно вести подсчет при работе с генераторами. Мне кажется, что двухэтапный процесс может привести меня к этому, но для теперь я в тупике.

Есть ли особенно элегантный / питонический способ сделать это, особенно с помощью генераторов?

28
задан Denis de Bernardy 15 June 2011 в 02:41
поделиться