Как заставить Regex игнорировать символы, отличные от кодировки символов Cp1252 [дубликат]

Что такое NullPointerException?

Хорошим местом для начала является JavaDocs . Они охватывают это:

Брошено, когда приложение пытается использовать null в случае, когда требуется объект. К ним относятся:

  • Вызов метода экземпляра нулевого объекта.
  • Доступ или изменение поля нулевого объекта.
  • Выполнение длины null, как если бы это был массив.
  • Доступ или изменение слотов с нулевым значением, как если бы это был массив.
  • Бросать нуль, как если бы это было значение Throwable.

Приложения должны бросать экземпляры этого класса для указания других незаконных видов использования нулевого объекта.

Также, если вы попытаетесь использовать нулевую ссылку с synchronized, который также выдаст это исключение, за JLS :

SynchronizedStatement:
    synchronized ( Expression ) Block
  • В противном случае, если значение выражения равно null, NullPointerException.

Как это исправить?

Итак, у вас есть NullPointerException. Как вы это исправите? Возьмем простой пример, который выдает NullPointerException:

public class Printer {
    private String name;

    public void setName(String name) {
        this.name = name;
    }

    public void print() {
        printString(name);
    }

    private void printString(String s) {
        System.out.println(s + " (" + s.length() + ")");
    }

    public static void main(String[] args) {
        Printer printer = new Printer();
        printer.print();
    }
}

Идентифицирует нулевые значения

. Первый шаг - точно определить , значения которого вызывают исключение . Для этого нам нужно выполнить некоторую отладку. Важно научиться читать stacktrace . Это покажет вам, где было выбрано исключение:

Exception in thread "main" java.lang.NullPointerException
    at Printer.printString(Printer.java:13)
    at Printer.print(Printer.java:9)
    at Printer.main(Printer.java:19)

Здесь мы видим, что исключение выбрано в строке 13 (в методе printString). Посмотрите на строку и проверьте, какие значения равны нулю, добавив протоколирующие операторы или используя отладчик . Мы обнаруживаем, что s имеет значение null, а вызов метода length на него вызывает исключение. Мы видим, что программа перестает бросать исключение, когда s.length() удаляется из метода.

Трассировка, где эти значения взяты из

Затем проверьте, откуда это значение. Следуя вызовам метода, мы видим, что s передается с printString(name) в методе print(), а this.name - null.

Трассировка, где эти значения должны быть установлены

Где установлен this.name? В методе setName(String). С некоторой дополнительной отладкой мы видим, что этот метод вообще не вызывается. Если этот метод был вызван, обязательно проверьте порядок , что эти методы вызывают, а метод set не будет называться после методом печати. ​​

Этого достаточно, чтобы дать нам решение: добавить вызов printer.setName() перед вызовом printer.print().

Другие исправления

Переменная может иметь значение по умолчанию setName может помешать ему установить значение null):

private String name = "";

Либо метод print, либо printString может проверить значение null например:

printString((name == null) ? "" : name);

Или вы можете создать класс, чтобы name всегда имел ненулевое значение :

public class Printer {
    private final String name;

    public Printer(String name) {
        this.name = Objects.requireNonNull(name);
    }

    public void print() {
        printString(name);
    }

    private void printString(String s) {
        System.out.println(s + " (" + s.length() + ")");
    }

    public static void main(String[] args) {
        Printer printer = new Printer("123");
        printer.print();
    }
}

См. также:

Я все еще не могу найти проблему

Если вы попытались отладить проблему и до сих пор не имеете решения, вы можете отправить вопрос для получения дополнительной справки, но не забудьте включить то, что вы пробовали до сих пор. Как минимум, включите stacktrace в вопрос и отметьте важные номера строк в коде. Также попробуйте сначала упростить код (см. SSCCE ).

240
задан Bobulous 19 April 2015 в 20:59
поделиться

21 ответ

Это зависит от языка, но должен быть модификатор, который вы можете добавить к шаблону регулярного выражения. В PHP это:

/(.*)<FooBar>/s

. S в конце заставляет точку соответствовать всем символам, включая символы новой строки.

178
ответ дан Jeremy Ruten 17 August 2018 в 22:21
поделиться
/(.*)<FooBar>/s

s вызывает Dot (.) для соответствия возврату каретки

5
ответ дан Bill 17 August 2018 в 22:21
поделиться
  • 1
    Похоже, что это неверно (Chrome): text.match (/ a / s) SyntaxError: недопустимые флаги, предоставленные в конструктор конструктора RegExp ' – Allen 9 May 2013 в 16:31
  • 2
    Потому что он не поддерживается в JavaScript RegEx. Флаги s существуют в PCRE, самом полном движке (доступно на Perl и PHP). PCRE имеет 10 флагов (и множество других функций), в то время как JavaScript имеет только 3 флага (gmi). – Morgan Touverey Quilling 20 April 2016 в 18:51

Часто нам нужно изменить подстроку с несколькими ключевыми словами, разбросанными по строкам, предшествующим подстроке. Рассмотрим элемент xml:

<TASK>
  <UID>21</UID>
  <Name>Architectural design</Name>
  <PercentComplete>81</PercentComplete>
</TASK>

Предположим, мы хотим изменить 81, к некоторому другому значению, скажем 40. Сначала определите .UID.21..UID., затем пропустите все символы, включая \n до .PercentCompleted.. Шаблон регулярного выражения и спецификация замены:

String hw = new String("<TASK>\n  <UID>21</UID>\n  <Name>Architectural design</Name>\n  <PercentComplete>81</PercentComplete>\n</TASK>");
String pattern = new String ("(<UID>21</UID>)((.|\n)*?)(<PercentComplete>)(\\d+)(</PercentComplete>)");
String replaceSpec = new String ("$1$2$440$6");
//note that the group (<PercentComplete>) is $4 and the group ((.|\n)*?) is $2.

String  iw = hw.replaceFirst(pattern, replaceSpec);
System.out.println(iw);

<TASK>
  <UID>21</UID>
  <Name>Architectural design</Name>
  <PercentComplete>40</PercentComplete>
</TASK>

Подгруппа (.|\n), вероятно, является отсутствующей группой $3. Если мы сделаем его не захватывающим с помощью (?:.|\n), то $3 будет (<PercentComplete>). Таким образом, шаблон и replaceSpec также могут быть:

pattern = new String("(<UID>21</UID>)((?:.|\n)*?)(<PercentComplete>)(\\d+)(</PercentComplete>)");
replaceSpec = new String("$1$2$340$5")

, и замена работает правильно, как и раньше.

0
ответ дан deadly 17 August 2018 в 22:21
поделиться

Для Eclipse работало следующее выражение:

Foo

jadajada Bar "

Регулярное выражение:

Foo[\S\s]{1,10}.*Bar*
7
ответ дан devOp 17 August 2018 в 22:21
поделиться

Попробуйте следующее:

((.|\n)*)<FooBar>

В основном он говорит «любой символ или символ новой строки», повторяющийся ноль или более раз.

236
ответ дан levik 17 August 2018 в 22:21
поделиться
  • 1
    Это зависит от языка и / или инструмента, который вы используете. Сообщите нам, что вы используете, например Perl, PHP, CF, C #, sed, awk и т. Д. – Ben Doom 1 October 2008 в 19:57
  • 2
    В зависимости от окончаний вашей линии вам может потребоваться ((.|\n|\r)*)<FooBar> – Potherca 9 March 2012 в 19:27
  • 3
    Он сказал, что использует Eclipse. Это, по моему мнению, правильное решение. У меня такая же проблема, и это решило. – Danubian Sailor 18 April 2012 в 09:14
  • 4
    Правильно - вопрос о затмении, а также теги. Но принятое решение - это PHP-решение. Ваш должен быть принятым решением ... – acme 13 June 2012 в 13:04
  • 5
    Это худшее регулярное выражение для сопоставления нескольких строк. Никогда не используйте его, если вы не используете ElasticSearch. Используйте [\s\S]* или (?s).*. – Wiktor Stribiżew 18 July 2016 в 11:05

"." обычно не соответствует разрыву строки. Большинство движков регулярных выражений позволяют вам добавить флагов S (также называемый DOTALL и SINGLELINE), чтобы "." также соответствовал символам новой строки. Если это не удается, вы можете сделать что-то вроде [\S\s].

8
ответ дан Markus Jarderot 17 August 2018 в 22:21
поделиться

мы также можем использовать

(.*?\n)*?

для соответствия всем, включая новую строку без жадного

. Это сделает новую строку опцией

(.*?|\n)*?
2
ответ дан Nambi Murugan 17 August 2018 в 22:21
поделиться

В JavaScript используйте /[\S\s]*<Foobar>/. Источник

28
ответ дан Nathan Arthur 17 August 2018 в 22:21
поделиться
  • 1
    Из этой ссылки: «JavaScript и VBScript не имеют возможности сделать символы разрыва строки с точками. В этих языках вы можете использовать класс символов, такой как [\ s \ S], чтобы соответствовать любому символу. & Quot; Вместо. вместо этого используйте [\ s \ S] (совпадающие пробелы и не-пробелы). – Allen 9 May 2013 в 16:34

В контексте использования в языках регулярные выражения действуют на строки, а не на строки. Таким образом, вы должны нормально использовать регулярное выражение, считая, что входная строка имеет несколько строк.

В этом случае заданное регулярное выражение будет соответствовать всей строке, так как «& lt; FooBar & gt;» настоящее. В зависимости от специфики реализации регулярного выражения значение $ 1 (полученное из «(. *)») Будет либо «fghij», либо «abcde\nfghij». Как говорили другие, некоторые реализации позволяют вам контролировать, является ли "." будет соответствовать новой строке, предоставив вам выбор.

Использование регулярных выражений на основе строк обычно используется для командной строки, например egrep.

1
ответ дан nsayer 17 August 2018 в 22:21
поделиться

Если вы используете поиск Eclipse, вы можете включить опцию «DOTALL», чтобы сделать «.». сопоставить любой символ, включая разделители строк: просто добавьте «(? s)» в начале строки поиска. Пример:

(?s).*<FooBar>
56
ответ дан Paulo Merson 17 August 2018 в 22:21
поделиться
  • 1
    Это не зависит от затмения, должно работать где угодно. – Steven Soroka 8 October 2013 в 17:50
  • 2
    Не где-нибудь, только в ароматах регулярных выражений, поддерживающих встроенные модификаторы, и, конечно же, не в Ruby, где (?s) = & gt; (?m) – Wiktor Stribiżew 18 July 2016 в 11:06

В регулярном выражении, основанном на java, вы можете использовать [\s\S]

2
ответ дан revo 17 August 2018 в 22:21
поделиться

([\s\S]*)<FooBar>

Точка соответствует всем, кроме строк новой строки (\r\n). Поэтому используйте \ s \ S, который будет соответствовать всем символам.

23
ответ дан samwize 17 August 2018 в 22:21
поделиться
  • 1
    Это решает проблему, если вы используете Objective-C [text rangeOfString:regEx options:NSRegularExpressionSearch]. Благодаря! – J. Costa 24 August 2012 в 23:29
  • 2
  • 3
    Это работает. Но это должно быть первое появление <FooBar> – Ozkan 26 September 2017 в 14:16

Используйте RegexOptions.Singleline, он меняет значение. включить новые строки

Regex.Replace (content, searchText, replaceText, RegexOptions.Singleline);

3
ответ дан shmall 17 August 2018 в 22:21
поделиться

Решение:

Использовать шаблонный модификатор sU получит желаемое соответствие в PHP.

example:

preg_match('/(.*)/sU',$content,$match);

Источник:

http://dreamluverz.com/developers-tools/regex-match-all-including-newline http://php.net/manual/en/reference.pcre .pattern.modifiers.php

2
ответ дан Sian Lerk Lau 17 August 2018 в 22:21
поделиться

У меня была такая же проблема и она была решена, возможно, не лучшим образом, но она работает. Я заменил все разрывы строк до того, как достиг своего реального соответствия:

mystring= Regex.Replace(mystring, "\r\n", "")

Я манипулирую HTML, поэтому разрывы строк для меня в этом случае не имеют большого значения.

Я попробовал все вышеперечисленные предложения без везения, я использую .Net 3.5 FYI

1
ответ дан Slee 17 August 2018 в 22:21
поделиться

Я хотел сопоставить конкретный блок if в java

   ...
   ...
   if(isTrue){
       doAction();

   }
...
...
}

. Если я использую regExp

if \(isTrue(.|\n)*}

, он включал замыкающую скобку для блока метода, поэтому я использовал

if \(!isTrue([^}.]|\n)*}

, чтобы исключить заключительную скобку из соответствия шаблону.

0
ответ дан Spangen 17 August 2018 в 22:21
поделиться

в целом. не соответствует символам новой строки, поэтому попробуйте ((.|\n)*)<foobar>

-1
ответ дан tloach 17 August 2018 в 22:21
поделиться
  • 1
    Нет, не делай этого. Если вам нужно сопоставить что-либо, включая разделители строк, используйте модификатор DOTALL (a.k.a. / s или SingleLine). Мало того, что (. |\n) hack делает регулярное выражение менее эффективным, это даже не правильно. По крайней мере, он должен соответствовать\r (возврат каретки), а также\n (linefeed). Существуют и другие разделители строк, хотя и редко используемые. Но если вы используете флаг DOTALL, вам не о чем беспокоиться. – Alan Moore 26 April 2009 в 04:17
  • 2
    \r - независимое от платформы соответствие для строк в Eclipse. – opyate 30 November 2009 в 12:13
  • 3
    @opyate Вы должны опубликовать это как ответ, поскольку этот маленький драгоценный камень невероятно полезен. – jeckhart 15 October 2012 в 22:29
  • 4
    Вы могли бы попробовать это вместо этого. Он не будет соответствовать внутренним скобкам, а также рассмотрит опцию \r .: ((?:.|\r?\n)*)<foobar> – ssc-hrep3 29 November 2016 в 10:52

Обратите внимание, что (.|\n)* может быть менее эффективным, чем (например) [\s\S]* (если регулярные выражения вашего языка поддерживают такие escape-последовательности), а не поиск того, как указать модификатор, который делает. также соответствуют новостям. Или вы можете пойти с альтернативами POSIXy, такими как [[:space:][:^space:]]*.

3
ответ дан tye 17 August 2018 в 22:21
поделиться

В Ruby вы можете использовать опцию 'm' (многострочный):

/YOUR_REGEXP/m

См. Regexp документацию на ruby-doc.org для получения дополнительной информации.

29
ответ дан Wiktor Stribiżew 17 August 2018 в 22:21
поделиться
  • 1
    Вы должны ссылаться на этот отличный обзор со страницы вашего профиля или что-то (+1). – Jan 15 October 2017 в 20:15
  • 2
    Вы можете добавить это в элемент boost : в пространстве имен regex_constants: flag_type_'s: perl = ECMAScript = JavaScript = JScript = :: boost :: regbase :: normal = 0, который по умолчанию соответствует Perl. Программисты установят определение флага базового флага #define MOD regex_constants::perl | boost::regex::no_mod_s | boost::regex::no_mod_m для своих флагов регулярного выражения, чтобы отразить это. И арбитр всегда встроенные модификаторы. Где (?-sm)(?s).* сбрасывается. – sln 26 April 2018 в 21:30
29
ответ дан Wiktor Stribiżew 6 September 2018 в 14:17
поделиться
31
ответ дан Wiktor Stribiżew 29 October 2018 в 20:38
поделиться
Другие вопросы по тегам:

Похожие вопросы: