почему это регулярное выражение приводит к катастрофическому обратному отскоку? [Дубликат]

Решение Mark может быть довольно дорогостоящим, так как оно должно синхронизироваться каждый раз.

Мы можем обойти необходимость синхронизации, используя шаблон хранения, специфичный для потока:


public class RandomNumber : IRandomNumber
{
    private static readonly Random Global = new Random();
    [ThreadStatic] private static Random _local;

    public int Next(int max)
    {
        var localBuffer = _local;
        if (localBuffer == null) 
        {
            int seed;
            lock(Global) seed = Global.Next();
            localBuffer = new Random(seed);
            _local = localBuffer;
        }
        return localBuffer.Next(max);
    }
}

Измерьте две реализации, и вы увидите значительную разницу.

240
задан Bobulous 19 April 2015 в 20:59
поделиться

20 ответов

Это зависит от языка, но должен быть модификатор, который вы можете добавить к шаблону регулярного выражения. В PHP это:

/(.*)<FooBar>/s

. S в конце заставляет точку соответствовать всем символам, включая символы новой строки.

178
ответ дан Jeremy Ruten 20 August 2018 в 21:50
поделиться
/(.*)<FooBar>/s

s вызывает Dot (.) для соответствия возврату каретки

5
ответ дан Bill 20 August 2018 в 21:50
поделиться
  • 1
    Похоже, что это неверно (Chrome): text.match (/ a / s) SyntaxError: недопустимые флаги, предоставленные в конструктор конструктора RegExp ' – Allen 9 May 2013 в 16:31
  • 2
    Потому что он не поддерживается в JavaScript RegEx. Флаги s существуют в PCRE, самом полном движке (доступно на Perl и PHP). PCRE имеет 10 флагов (и множество других функций), в то время как JavaScript имеет только 3 флага (gmi). – Morgan Touverey Quilling 20 April 2016 в 18:51

Часто нам нужно изменить подстроку с несколькими ключевыми словами, разбросанными по строкам, предшествующим подстроке. Рассмотрим элемент xml:

<TASK>
  <UID>21</UID>
  <Name>Architectural design</Name>
  <PercentComplete>81</PercentComplete>
</TASK>

Предположим, мы хотим изменить 81, к некоторому другому значению, скажем 40. Сначала определите .UID.21..UID., затем пропустите все символы, включая \n до .PercentCompleted.. Шаблон регулярного выражения и спецификация замены:

String hw = new String("<TASK>\n  <UID>21</UID>\n  <Name>Architectural design</Name>\n  <PercentComplete>81</PercentComplete>\n</TASK>");
String pattern = new String ("(<UID>21</UID>)((.|\n)*?)(<PercentComplete>)(\\d+)(</PercentComplete>)");
String replaceSpec = new String ("$1$2$440$6");
//note that the group (<PercentComplete>) is $4 and the group ((.|\n)*?) is $2.

String  iw = hw.replaceFirst(pattern, replaceSpec);
System.out.println(iw);

<TASK>
  <UID>21</UID>
  <Name>Architectural design</Name>
  <PercentComplete>40</PercentComplete>
</TASK>

Подгруппа (.|\n), вероятно, является отсутствующей группой $3. Если мы сделаем его не захватывающим с помощью (?:.|\n), то $3 будет (<PercentComplete>). Таким образом, шаблон и replaceSpec также могут быть:

pattern = new String("(<UID>21</UID>)((?:.|\n)*?)(<PercentComplete>)(\\d+)(</PercentComplete>)");
replaceSpec = new String("$1$2$340$5")

, и замена работает правильно, как и раньше.

0
ответ дан deadly 20 August 2018 в 21:50
поделиться

Для Eclipse работало следующее выражение:

Foo

jadajada Bar "

Регулярное выражение:

Foo[\S\s]{1,10}.*Bar*
7
ответ дан devOp 20 August 2018 в 21:50
поделиться

Попробуйте следующее:

((.|\n)*)<FooBar>

В основном он говорит «любой символ или символ новой строки», повторяющийся ноль или более раз.

236
ответ дан levik 20 August 2018 в 21:50
поделиться
  • 1
    Это зависит от языка и / или инструмента, который вы используете. Сообщите нам, что вы используете, например Perl, PHP, CF, C #, sed, awk и т. Д. – Ben Doom 1 October 2008 в 19:57
  • 2
    В зависимости от окончаний вашей линии вам может потребоваться ((.|\n|\r)*)<FooBar> – Potherca 9 March 2012 в 19:27
  • 3
    – Danubian Sailor 18 April 2012 в 09:14
  • 4
    Правильно - вопрос о затмении, а также теги. Но принятое решение - это PHP-решение. Ваш должен быть принятым решением ... – acme 13 June 2012 в 13:04
  • 5
    Это худшее регулярное выражение для сопоставления нескольких строк. Никогда не используйте его, если вы не используете ElasticSearch. Используйте [\s\S]* или (?s).*. – Wiktor Stribiżew 18 July 2016 в 11:05

"." обычно не соответствует разрыву строки. Большинство движков регулярных выражений позволяют вам добавить флагов S (также называемый DOTALL и SINGLELINE), чтобы "." также соответствовал символам новой строки. Если это не удается, вы можете сделать что-то вроде [\S\s].

8
ответ дан Markus Jarderot 20 August 2018 в 21:50
поделиться

мы также можем использовать

(.*?\n)*?

для соответствия всем, включая новую строку без жадного

. Это сделает новую строку опцией

(.*?|\n)*?
3
ответ дан Nambi Murugan 20 August 2018 в 21:50
поделиться

В JavaScript используйте /[\S\s]*<Foobar>/. Источник

28
ответ дан Nathan Arthur 20 August 2018 в 21:50
поделиться
  • 1
    Из этой ссылки: «JavaScript и VBScript не имеют возможности сделать символы разрыва строки с точками. В этих языках вы можете использовать класс символов, такой как [\ s \ S], чтобы соответствовать любому символу. & Quot; Вместо. вместо этого используйте [\ s \ S] (совпадающие пробелы и не-пробелы). – Allen 9 May 2013 в 16:34

В контексте использования в языках регулярные выражения действуют на строки, а не на строки. Таким образом, вы должны нормально использовать регулярное выражение, считая, что входная строка имеет несколько строк.

В этом случае заданное регулярное выражение будет соответствовать всей строке, так как «& lt; FooBar & gt;» настоящее. В зависимости от специфики реализации регулярного выражения значение $ 1 (полученное из «(. *)») Будет либо «fghij», либо «abcde\nfghij». Как говорили другие, некоторые реализации позволяют вам контролировать, является ли "." будет соответствовать новой строке, предоставив вам выбор.

Использование регулярных выражений на основе строк обычно используется для командной строки, например egrep.

1
ответ дан nsayer 20 August 2018 в 21:50
поделиться

Если вы используете поиск Eclipse, вы можете включить опцию «DOTALL», чтобы сделать «.». сопоставить любой символ, включая разделители строк: просто добавьте «(? s)» в начале строки поиска. Пример:

(?s).*<FooBar>
56
ответ дан Paulo Merson 20 August 2018 в 21:50
поделиться
  • 1
    Это не зависит от затмения, должно работать где угодно. – Steven Soroka 8 October 2013 в 17:50
  • 2
    Не где-нибудь, только в ароматах регулярных выражений, поддерживающих встроенные модификаторы, и, конечно же, не в Ruby, где (?s) = & gt; (?m) – Wiktor Stribiżew 18 July 2016 в 11:06

В регулярном выражении, основанном на java, вы можете использовать [\s\S]

2
ответ дан revo 20 August 2018 в 21:50
поделиться

([\s\S]*)<FooBar>

Точка соответствует всем, кроме строк новой строки (\r\n). Поэтому используйте \ s \ S, который будет соответствовать всем символам.

23
ответ дан samwize 20 August 2018 в 21:50
поделиться
  • 1
    Это решает проблему, если вы используете Objective-C [text rangeOfString:regEx options:NSRegularExpressionSearch]. Благодаря! – J. Costa 24 August 2012 в 23:29
  • 2
    Это работает в intelliJ's find & amp; replace regex, спасибо. – barclay 16 September 2015 в 22:14
  • 3
    Это работает. Но это должно быть первое появление <FooBar> – Ozkan 26 September 2017 в 14:16

Используйте RegexOptions.Singleline, он меняет значение. включить новые строки

Regex.Replace (content, searchText, replaceText, RegexOptions.Singleline);

3
ответ дан shmall 20 August 2018 в 21:50
поделиться

Решение:

Использовать шаблонный модификатор sU получит желаемое соответствие в PHP.

example:

preg_match('/(.*)/sU',$content,$match);

Источник:

http://dreamluverz.com/developers-tools/regex-match-all-including-newline http://php.net/manual/en/reference.pcre .pattern.modifiers.php

2
ответ дан Sian Lerk Lau 20 August 2018 в 21:50
поделиться

У меня была такая же проблема и она была решена, возможно, не лучшим образом, но она работает. Я заменил все разрывы строк до того, как достиг своего реального соответствия:

mystring= Regex.Replace(mystring, "\r\n", "")

Я манипулирую HTML, поэтому разрывы строк для меня в этом случае не имеют большого значения.

Я попробовал все вышеперечисленные предложения без везения, я использую .Net 3.5 FYI

1
ответ дан Slee 20 August 2018 в 21:50
поделиться

Я хотел сопоставить конкретный блок if в java

   ...
   ...
   if(isTrue){
       doAction();

   }
...
...
}

. Если я использую regExp

if \(isTrue(.|\n)*}

, он включал замыкающую скобку для блока метода, поэтому я использовал

if \(!isTrue([^}.]|\n)*}

, чтобы исключить заключительную скобку из соответствия шаблону.

0
ответ дан Spangen 20 August 2018 в 21:50
поделиться

в целом. не соответствует символам новой строки, поэтому попробуйте ((.|\n)*)<foobar>

-1
ответ дан tloach 20 August 2018 в 21:50
поделиться
  • 1
    Нет, не делай этого. Если вам нужно сопоставить что-либо, включая разделители строк, используйте модификатор DOTALL (a.k.a. / s или SingleLine). Мало того, что (. |\n) hack делает регулярное выражение менее эффективным, это даже не правильно. По крайней мере, он должен соответствовать\r (возврат каретки), а также\n (linefeed). Существуют и другие разделители строк, хотя и редко используемые. Но если вы используете флаг DOTALL, вам не о чем беспокоиться. – Alan Moore 26 April 2009 в 04:17
  • 2
    \r - независимое от платформы соответствие для строк в Eclipse. – opyate 30 November 2009 в 12:13
  • 3
    @opyate Вы должны опубликовать это как ответ, поскольку этот маленький драгоценный камень невероятно полезен. – jeckhart 15 October 2012 в 22:29
  • 4
    Вы могли бы попробовать это вместо этого. Он не будет соответствовать внутренним скобкам, а также рассмотрит опцию \r .: ((?:.|\r?\n)*)<foobar> – ssc-hrep3 29 November 2016 в 10:52

Обратите внимание, что (.|\n)* может быть менее эффективным, чем (например) [\s\S]* (если регулярные выражения вашего языка поддерживают такие escape-последовательности), а не поиск того, как указать модификатор, который делает. также соответствуют новостям. Или вы можете пойти с альтернативами POSIXy, такими как [[:space:][:^space:]]*.

3
ответ дан tye 20 August 2018 в 21:50
поделиться

В Ruby вы можете использовать опцию 'm' (многострочный):

/YOUR_REGEXP/m

См. Regexp документацию на ruby-doc.org для получения дополнительной информации.

29
ответ дан Wiktor Stribiżew 20 August 2018 в 21:50
поделиться
  • 1
    Вы должны ссылаться на этот отличный обзор со страницы вашего профиля или что-то (+1). – Jan 15 October 2017 в 20:15
  • 2
    Вы можете добавить это в элемент boost : в пространстве имен regex_constants: flag_type_'s: perl = ECMAScript = JavaScript = JScript = :: boost :: regbase :: normal = 0, который по умолчанию соответствует Perl. Программисты установят определение флага базового флага #define MOD regex_constants::perl | boost::regex::no_mod_s | boost::regex::no_mod_m для своих флагов регулярного выражения, чтобы отразить это. И арбитр всегда встроенные модификаторы. Где (?-sm)(?s).* сбрасывается. – sln 26 April 2018 в 21:30
31
ответ дан Wiktor Stribiżew 31 October 2018 в 16:54
поделиться
Другие вопросы по тегам:

Похожие вопросы: