Заменить повторяющиеся строки в строке

Я пытаюсь найти (и заменить) повторяющуюся строку в строке.

Моя строка может выглядеть так:

Lorem ipsum dolor sit amet sit amet sit amet sit nostrud упражнения amit sit ullamco labouris nisi ut aliquip ex ea Commodo Conquat.

Это должно стать:

Lorem ipsum dolor sit amet sit nostrud упражнение amit sit ullamco labouris nisi ut aliquip ex ea Commodo Concequat.

Обратите внимание на amit sit не удаляется, так как не повторяется.

Или строка может быть такой:

Lorem ipsum dolor sit amet () sit amet () sit amet () sit nostrud упражнения ullamco labouris nisi ut aliquip aliquip ex ea Commodo Concequat.

который должен стать:

Lorem ipsum dolor sit amet () sit nostr ud упражнения ullamco labouris nisi ut aliquip ex ea Commodo Concequat.

Таким образом, это не только буквы a-z, но также могут иметь другие символы (ascii). Я очень рад, если кто-то может мне помочь с этим.

Следующим шагом будет сопоставление (и замена) чего-то вроде этого:

2 вопроса 3 вопроса 4 вопроса 5 вопросов

, которые станут:

2 вопроса

Число в окончательном выводе может быть любым числом 2,3,4, это не имеет значения. Только в последнем примере будут разные числа, но слова будут такими же.

5
задан Nin 21 July 2011 в 19:55
поделиться