Удалить повторяющиеся слова в строке с помощью sed

Чисто академический, но это меня расстраивает.

Я хочу исправить этот текст:

there there are are multiple lexical errors in this line line

с помощью sed. Я дошел до этого:

sed 's/\([a-z][a-z]*[ ,\n][ ,\n]*\)\1/\1/g' < file.text

Он исправляет все, кроме последних двойных слов!

there are multiple lexical errors in this line line

Может ли гуру sed объяснить, почему приведенное выше не касается слова в конце?

7
задан benjwy 15 May 2012 в 11:48
поделиться