Можно ли переписать регулярные выражения, содержащие упорядоченное чередование, чтобы использовать только неупорядоченное чередование?

Предположим, у меня есть язык регулярных выражений, поддерживающий литералы, классы положительных и отрицательных символов, упорядоченное чередование, жадные квантификаторы ? , * и + и нелицеприятные квантификаторы ?? , *? и +? . (Это, по сути, подмножество PCRE без обратных ссылок, проверочных утверждений или некоторые другие более причудливые биты.) Уменьшает ли замена упорядоченного чередования неупорядоченным чередованием выразительную силу этого формализма?

(Неупорядоченное чередование - также иногда называемое «неупорядоченным выбором» - таково, что L (S | T) = L (S) + L (T), а упорядоченное чередование таково, что L (S | T) = L (S) + (L (T) - {a в L (T): a расширяет некоторый b in L (S)}). Конкретно, шаблон a | aa будет соответствовать строкам a и aa , если чередование неупорядочено, но только ] a , если чередование упорядочено.)

Другими словами, задано ap attern S, содержащий упорядоченное чередование, можно ли переписать этот шаблон в эквивалентный шаблон T, который не содержит упорядоченных чередований (но, возможно, вместо этого неупорядоченные чередования)?

Если этот вопрос рассматривался в литературе, я был бы признателен за любые ссылки, которые любой может предоставить. Мне не удалось найти почти никаких теоретических работ о выразительной силе формализмов расширенных регулярных выражений (помимо обычных вещей о том, как обратные ссылки переводят вас с обычных языков на контекстно-свободные грамматики).

7
задан uckelman 20 July 2011 в 18:33
поделиться