Как сделать, чтобы точка соответствовала символам новой строки, используя регулярные выражения

NullPointerException s - исключения, возникающие при попытке использовать ссылку, которая указывает на отсутствие местоположения в памяти (null), как если бы она ссылалась на объект. Вызов метода по нулевой ссылке или попытка получить доступ к полю нулевой ссылки вызовет функцию NullPointerException. Они наиболее распространены, но другие способы перечислены на странице NullPointerException javadoc.

Вероятно, самый быстрый пример кода, который я мог бы придумать для иллюстрации NullPointerException, be:

public class Example {

    public static void main(String[] args) {
        Object obj = null;
        obj.hashCode();
    }

}

В первой строке внутри main я явно устанавливаю ссылку Object obj равной null. Это означает, что у меня есть ссылка, но она не указывает на какой-либо объект. После этого я пытаюсь обработать ссылку так, как если бы она указывала на объект, вызывая метод на нем. Это приводит к NullPointerException, потому что нет кода для выполнения в местоположении, на которое указывает ссылка.

(Это техничность, но я думаю, что она упоминает: ссылка, которая указывает на null, равна 't то же, что и указатель C, указывающий на недопустимую ячейку памяти. Нулевой указатель буквально не указывает на в любом месте , который отличается от указаний на местоположение, которое оказывается недопустимым.)

25
задан MattBelanger 31 December 2009 в 16:04
поделиться

2 ответа

Необходимо использовать модификатор DOTALL .

'/<div>(.*)<\/div>/s'

Это может не дать вам именно то, что вы хотите, потому что вы жадно подходите. Вместо этого вы можете попробовать не жадное совпадение:

'/<div>(.*?)<\/div>/s'

Вы также можете решить эту проблему путем сравнения всего, кроме '<', если нет других тегов:

'/<div>([^<]*)<\/div>/'

Другое наблюдение заключается в том, что вам не нужно использовать / в качестве разделителей регулярных выражений. Использование другого символа означает, что нет необходимости экранировать / в

, улучшая читабельность. Это относится ко всем вышеперечисленным регулярным выражениям. Вот как бы это выглядело, если бы вы использовали '#' вместо '/':

'#<div>([^<]*)</div>#'

Однако все эти решения могут не сработать из-за вложенных divs, лишних пробелов, HTML комментариев и различных других вещей. HTML слишком сложен для разбора с помощью Regex, поэтому вам следует подумать об использовании парсера HTML.

39
ответ дан 28 November 2019 в 04:44
поделиться

Обычно в компиляторе регулярных выражений есть флаг, указывающий, что точка должна соответствовать символам новой строки.

0
ответ дан 28 November 2019 в 04:44
поделиться
Другие вопросы по тегам:

Похожие вопросы: