Предположим, у меня есть язык регулярных выражений, поддерживающий литералы, классы положительных и отрицательных символов, упорядоченное чередование, жадные квантификаторы ?
, *
и +
и нелицеприятные квантификаторы ??
, *?
и +?
. (Это, по сути, подмножество PCRE без обратных ссылок, проверочных утверждений или некоторые другие более причудливые биты.) Уменьшает ли замена упорядоченного чередования неупорядоченным чередованием выразительную силу этого формализма?
(Неупорядоченное чередование - также иногда называемое «неупорядоченным выбором» - таково, что L (S | T) = L (S) + L (T), а упорядоченное чередование таково, что L (S | T) = L (S) + (L (T) - {a в L (T): a расширяет некоторый b in L (S)}). Конкретно, шаблон a | aa
будет соответствовать строкам a
и aa
, если чередование неупорядочено, но только ] a
, если чередование упорядочено.)
Другими словами, задано ap attern S, содержащий упорядоченное чередование, можно ли переписать этот шаблон в эквивалентный шаблон T, который не содержит упорядоченных чередований (но, возможно, вместо этого неупорядоченные чередования)?
Если этот вопрос рассматривался в литературе, я был бы признателен за любые ссылки, которые любой может предоставить. Мне не удалось найти почти никаких теоретических работ о выразительной силе формализмов расширенных регулярных выражений (помимо обычных вещей о том, как обратные ссылки переводят вас с обычных языков на контекстно-свободные грамматики).